论文部分内容阅读
在现代维吾尔语中名词是词汇中占最大比例的词类之一。随着现代信息技术的快速发展,英语、汉语等很多种语言的名词自动识别研究已经发展到一定的程度,维吾尔语名词识别研究还处于初步阶段。维吾尔语名词在句子中的位置也不固定,还有同性词的意义。我们在社会语言领域按照上下文识别名词,但这些方法引用到计算机研究方法和内容上存在着很多的问题和不足之处。通过近几年来在语言学研究领域内产生的计算语言学,语料库语言学等一些新的学科,可以处理这些问题。物理学作为一门自然学科,在基础教育阶段处于直观重要的地位,它不像文学等其他教材和文献,具有很强的专业性。研究物理教材的名词,远远高于研究语法特征和修辞性。本文的主要工作是按照维吾尔文中的名词构词方法,探素识别规则,基于规则的方法来识别名词,对名词识别进行研究。使用匹配词干库、匹配规则库和人工识别等三种方法进行识别,并对识别结果与语料库的总词库进行比较分析。现代维吾尔语名词识别在传统语言学方面已被进行深入探讨并形成了较完善的理论体系,但是在信息技术方面尚未开发识别算法。名词识别研究的实现将对维吾尔语词类识别工作提供基础。维吾尔语名词的自动识别、为识别动词、数词、量词等词类提供方便。名词识别中用名词词干库匹配、规则库匹配和人工识别等多种方法相结合,用这些所总结的方法也可以推广到其他领域,完善后甚至应用到整个维吾尔文名词的识别中本论文由绪论、正文、结论及参考文献等四部分组成。第一章绪论部分由选题的背景、研究目的及意义,研究内容等;本课题的国外、国内、区内现状和本论文所采用的方法组成。第二章主要阐述了名词概念、名词的语法特征、名词在语言生活中的应用、名词识别规则,词尾歧义并处理方法等。第三章主要陈述选择语料库的依据、对语料库的数据进行统计、分析统计结果。第四章主要陈述维吾尔语名词自动识别系统及应用并基于规则的处理。第五章主要对本论文进行总结并提出展望。