面向信息处理的带典型前缀派生词的识别分析

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:baihe143
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要是采取语料库语言学的方法,对我们要研究的对象进行统计和分析,得出识别的规则,并最终找到识别的方法。全文共分六章:第一章是绪论部分。本章我们主要是论述选择前缀自动识别的意义,以及对研究现状进行总结性的论述,并对本文的研究思路、整体框架以及研究方法等进行陈述,对前缀的特征性质进行概括。第二章是对识别总体思路的分析。本章我们主要是论述目前中文信息处理在自动分词和自动标注方面所采用的方法,从而分析我们所要研究的自动分词和词性标注方面的思路,为下面几章的研究打下基础。第三章是对带前缀“老”的派生词的识别分析。本章我们通过对语料库的分析与统计,得出了含语素“老”的双音节及多音节词语的词表,利用统计和规则相结合的办法完成了对带前缀“老”的派生词的自动识别。第四章是对带前缀“阿”的派生词的识别分析。本章我们通过对语料库的分析与统计,得出了含语素“阿”的双音节及多音节词语的词表,利用统计和规则相结合的办法完成了对带前缀“阿”的派生词的自动识别。第五章是对带前缀“小”的派生词的识别分析。本章我们通过对语料库的分析与统计,得出了含语素“小”的双音节及多音节词语的词表,利用统计和规则相结合的办法完成了对带前缀“小”的派生词的自动识别。第六章是自动识别的算法设计。本章我们会总结前几章的研究成果,最终找出典型前缀的识别策略并画出识别流程图。最后说明本文的不足之处并找出可以进一步研究的地方。
其他文献
在自然语言理解中汉语的歧义现象是非常普遍的,歧义的存在对语义的理解造成了很大的困难。尤其是名词性短语的歧义格式,它们通过名词间并列和偏正的耦合关系生成语法歧义结构
网络已经融入到大学生生活和学习的方方面面,成为影响当代大学生生活方式的最重要因素。大学生利用网络开展社交既拓展了他的交往空间和社交行为,同样,也改变了他的学习方式
在钢结构中施加预应力可以改善结构的受力状态,增大结构的刚度,达到节约材料、降低造价的目的。近年来,预应力钢结构研究的工作主要是集中在预应力钢桁架、拉杆、压杆等方面,
隐喻是复杂的社会文化现象和心理现象,其产生和理解都是语言使用者对语言形式和策略的选择。本文从认知语言学和语用学的角度来探讨隐喻的工作机制。维索尔伦的顺应性理论能
语境对话语的理解具有重要的作用,一向受语义学家、语用学家、人类学家、哲学家、和认知语言学家的关注。语境是一个动态的、发展的概念。交际本身就是一个动态的不断发展变
蒙语授课教学是国民教育的重要组成部分,也是民族教育工作的重要内容。构建和谐社会的今天,进一步发展经济欠发达地区民族教育是当务之急。在党的十七大里明确的提出了鼓励地
河北省是我国最缺水的地区之一,水资源匮乏、水体污染与水生态环境恶化等水资源危机已成为该省经济社会发展和生态环境建设的重要制约因素,“水”从定位于农业的命脉,将提升
在中国当代作家中,李锐对全球化带来的文化淹没具有清醒的警惕和反思意识。李锐彻底的反思性不仅在很大程度上决定了他文学写作的题材和形式,而且使他的小说创作表现出两两相
胃癌是最常见的消化道恶性肿瘤之一,严重威胁着人类的健康。随着医学诊疗技术的进步,目前对于胃癌的治疗是多学科、综合性的,但手术仍然是其中最主要的治疗方法。胃癌外科治
残疾人职业能力评估关乎残疾人职业训练和就业安置的内容、方向及效果。国际上残疾人职业能力评估起步较早,经验丰富。对美国、英国、澳大利亚和中国港台地区等地残疾人职业