论文部分内容阅读
针对维吾尔单词切分问题提出了FCM融合K-means的聚类算法,应用FCM聚类的结果将字符间距聚类两类,根据聚类结果再将字符间距分类为三类:单词内间距、单词间距离、第三类间距;将字符长度聚类为:单词、连体段、字母。首先对单词内距离进行处理,再针对不同的字符间距和不同的字符长度进行分步切分处理,最后对切分后的字符进行欠切分处理。以12幅不同的人书写的维吾尔脱机手写文本图像为实验对象,1 042个单词,正确切分率达到74.28%。该方法不仅仅提高了切分的正确率,并且可以同时解决部分重叠和粘连问题。