面向框架语义的汉语短语自动识别研究

来源 :山西大学 | 被引量 : 9次 | 上传用户:leoni002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语短语的自动识别一直是自然语言处理领域的研究焦点之一,对信息抽取、问答系统、机器翻译等方面的研究有着十分重要的价值。短语的自动识别是句法分析的一个子问题,句法分析又是框架语义分析的必要前提,而面向框架语义分析的短语自动识别有其特定的要求,因此单纯的短语识别任务不能满足框架语义分析的需要。 本文面向框架语义分析的任务,采用不同的机器学习方法对文本中的名词短语和动词短语进行识别,构造了不同的识别系统,取得了比较满意的识别结果。其研究内容如下: 1.基于转换的名词短语的识别。针对框架语义分析的目的,在分析真实语料的基础上,提出了适合于框架语义分析的汉语名词短语的定义。介绍了基于转换的机器学习方法及基于转换的算法,给出在识别名词短语中的转换条件,实验证明利用转换的方法识别名词短语是可行的,并对实验结果进一步分析,提出了改进办法。 2.基于最大熵模型识别名词短语。在识别过程中,首先特征选择,其次建立模型训练和文本标注两部分组成的名词短语识别系统。通过对系统的执行,显示了较好的效果。 3.基于规则的动词短语的识别。通过对语料的分析并针对识别的目的,定义了适合框架语义分析的动词短语。根据功能合一语法定制了识别动词短语的规则,并利用这些规则对动词短语进行自动识别。实验结果显示了较高的召回率和正确率。 4.面向框架语义的汉语句法语义分析模型。介绍了汉语框架网络的
其他文献
高炉生产是在高温、高压、密闭条什下进行的黑箱操作,实时了解炉内料面的分布情况对于优化高炉操作有着十分重要的意义。在传统的高炉操作中,操作人员主要通过分析炉内探尺数据
本文以“基于DeltaV的工业过程实验装置”为研究对象,应用该装置进行控制系统算法及其实现方面有关问题的研究。作为实验室中模拟工业过程的实验装置,在此装置上设计完成了针
本论文是围绕“船舶减摇水舱试验装置”展开的。 减摇水舱是应用最广泛的船舶减横摇装置之一,它特别适用于经常工作在零航速或低航速的船舶减摇,如车客轮渡、滚装船和科学考
人类对资源的需求越来越大,海洋资源开发技术已经成为现在研究的热门领域。对于在海上长时间作业的船舶或平台来说,在中等海况下,如何在深海安全作业,既保证系泊缆安全又能节
随人们思想的进步和市场竞争的加剧,传统的通信手段已经不能满足人们的需求。计算机网络技术的快速发展和广泛应用,为人们之间的信息交流提供了更加便捷、高效、实时的通信方
从上个世纪九十年代以来,脑功能成像技术得到了广泛应用和长足发展。脑功能成像最大的优点就是无损伤,可以直接对人脑进行反复的非侵入性观察测量。 在高级脑功能成像的研究
现今世界上节能和环保正日益受到重视,因此电动车技术的发展步伐正在加快。无刷直流电动机是一种电机、电子一体化的高新技术产品,具有结构简单、运行可靠等优点,在现代工业中应
传统的单纯提供内容服务的Web单页面服务,页面之间没有交互性,而且页面是静态的,而目前典型的电子商业化的Web应用,提供的服务一般都是传统企业的传统业务在网络上的实现,用
迭代学习控制(Iterative Learning Control简称ILC)是智能控制理论的一个重要分支。迭代学习控制适用于那些具有重复运动特性的被控对象,它利用控制系统先前的控制经验,根据系
竖炉焙烧生产过程作为选矿厂整个生产流程中的一个重要环节,其主要任务是将弱磁性的赤铁矿通过高温还原处理转变为强磁性的铁矿石,以满足磁选管回收率(MTRR)、台时产量、煤气消