论文部分内容阅读
维吾尔语是黏着语,具有比较复杂的形态变化.不管是维吾尔文词典的编纂,还是搜索引擎的开发,或机器翻译系统的研究,都需要对已变形的单词进行形态还原.形态还原或词干提取算法是具有形态变化的所有语言必须研究的课题.本文中比较详细地描述了维吾尔语名词词干提取所存在的问题,并对其进行了分析.提出了基于有限状态自动机和词典查询相结合的维吾尔语名词词干提取算法.从而实现了以较高的准确率处理未登录词的词干提取算法.