中文缺省识别研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:wanghuia23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文语句中广泛存在着缺省现象。中文缺省识别是自然语言处理中的一个重要研究课题,在机器翻译,文本分类以及信息抽取等领域中都有重要应用。中文缺省识别研究目前尚处于起步阶段,相关的研究工作甚少。国内在中文缺省方面的研究大都处于理论层次,并没有系统地、有效地识别方法和实现系统。本文深入分析了现有的中文缺省识别技术并在以下几个方面进行了研究:(1)首先,针对中文缺省研究缺乏语料的现状,手工标注一个用于中文缺省识别的基准语料库;然后,在对中文缺省句法结构研究的基础上,归纳了六种最常见的中文缺省句法结构;最后,本文分析了中文缺省识别的难点和解决方案,并给出了不同的识别方法。(2)探讨了基于规则的方法,分析不同的动词形式以及缺省位置的情况,以动词驱动为核心,提取规则来获得缺省项信息。实验结果表明,本文实现的基于规则的中文缺省识别方法具有可行性。(3)针对中文缺省识别主要依赖上下文信息的特点,利用基于SVM(Support Vector Machine)的卷积树核函数来获取句法结构信息,并且重点研究中文缺省识别不同的句法裁剪策略。实验结果表明,采用树核函数的方法与规则的方法相比,性能有所提高,对中文缺省识别有比较大的研究价值。
其他文献
我们是主动地选择了这份工作、这项事业,我们就应该对这份工作充满着激情与热爱,我们就应该用我们的光和热去影响着他 们、教导着他们,争取让他们都能成人成才,做到培养一个人才,
选取我院2011年1月~2012年12月80例频发短暂性脑缺血患者,随机分成观察组和对照组,观察组给予巴曲酶联合阿司匹林,对照组给予阿司匹林,对比分析两组患者临床治疗效果。结果观
对新生儿科住院的2387例早产儿、病理性黄疸患儿进行床旁快速血氨检测,探讨影响新生儿血氨的相关因素。结果发现诱发新生儿高氨血症的因素一方面来源于先天性遗传代谢性疾病,
<正> 《人民日报·海外版》2000年8月18日第12版随着中国对外开放,越来越多的华侨回国投资,人类学家对侨商的寻根经济持有独到的看法。经济学家通常只看到,侨商投资的目的是
会议
选取精神分裂症患者26例,随机分为管理组与常规组各13例。给予管理组为期3个月的自我管理训练指导,常规组进行分散制自由活动,由专门的医务人员于两组患者管理前后分别实施精神
随着我国经济能力的快速发展,我国人均生活水平效率也在不断提升,汽车作为人们日常出行的必要交通工具,环境以及社会 发展对汽车自身的性能要求提出了多重考验。首先,是汽车发动
随着人民生活水平的提升,对建筑外观的要求逐年上升。建筑工程设计人员将建筑幕墙设计元素应用于建筑外立面设计之中得 到了人们的喜爱。毕竟一个优秀的建筑外立面设计能够明
<正>洛南县财政局2012年创建成为省级文明单位。近年来该局围绕创建目标,落实责任,严格要求,强化措施,实现了文明单位创建巩固与财政工作的双赢。该局的主要做法是:一、加强
期刊
目的评价认知心理干预对血液系统恶性肿瘤患者的抑郁情绪、焦虑状态以及社会功能的改善情况。方法将150例血液系统恶性肿瘤患者随机分为研究组(药物加认知心理干预)和对照组(
随着教育体制的深入改革,提高小学语文教学的有效性已经成为当下素质教育的重要目标。而朗读教学作为小学语文教学的重 要组成部分,对提高小学生的语文素养和综合素质具有至关