汉语优选语义类的自动获取研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:dlf123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义选择限制是重要的词汇语义知识,可用于自然语言处理领域的多个任务,比如隐喻计算、句法分析、语义角色标注、词义消歧、指代消解、机器翻译等。目前通过手工构建的语义选择限制知识库已经很难满足自然语言处理的需求,需要基于大规模语料自动地获取语义选择限制知识。本文针对汉语语义类层面的语义选择限制——汉语优选语义类,提出了一种基于最小描述长度原则和语义分类体系的自动获取模型,并构建了语义选择限制知识库。主要研究内容包括:(1)对现有知识库中语义选择限制的统计与分析。首先将HowNet蕴含的选择限制知识系统地提取出来,并对VerbNet和SKCC中的选择限制知识进行归纳与统计。对三者进行分析和比较发现,VerbNet和HowNet的选择限制基本一致,互为补充会更加完善,SKCC对动词的主体和客体的选择限制更加严格。(2)从语料库中获取语义选择限制知识。提出了基于最小描述长度原则和语义分类体系的汉语语义选择限制自动获取模型。对HowNet现有的名词语义分类体系进行改造,而后基于大规模语料获取选择限制知识。伪消歧实验显示,本文所提出的方法优于基于KL距离的方法。将SKCC中的选择限制知识用作标准测试集,用来衡量基于调整后的SKCC名词语义分类体系获取到的选择限制知识,在宽松衡量标准下取得了75.26%的正确率。(3)构建语义选择限制知识库。通过现代汉语词典(第五版)为多义词的每个义项匹配种子词,然后计算目标词的词向量和种子词的词向量之间的余弦相似度,将目标词划分到不同的义项中,达到词义消歧的目的,最终构建了动词-客体的语义选择限制知识库。本文面向语义知识库建设,统计和分析了现有知识库中语义选择限制知识,并提出了一种基于语义分类体系及最小描述长度原则的汉语语义选择限制获取方法,对比实验表明本文方法的有效性。
其他文献
结合参与开发PLM项目的一个子系统——日程管理系统,论述如何运用基于J2EE架构的Weblogic8.1服务器以及JSP+Jav-aBean技术实现一个功能完备的B/S模式的Web应用系统。
我知道位于广东省东北部的河源这个地名,始自于一部古典小说《镜花缘》。
对高取代度阳离子淀粉 (DS0 .5 0 1)用作絮凝剂处理废纸脱墨废水进行了研究 ,研究结果表明 ,高取代度阳离子淀粉和无机絮凝剂 (PAC ,硫酸铝等 )及有机絮凝剂 (PAM)复配使用效
根据南昌市廊道特点,将廊道划分为:灰色廊道、绿色廊道和蓝色廊道,利用GIS和CAD的图形分析和处理功能,获取了南昌市各类廊道现状图,并绘制出相应拓扑图。对南昌市绿色廊道景
介绍了生物基含量的定义,综述了14C含量的3种测定方法,包括加速器质谱法(AMS)、液体闪烁计数器法(LSC)、β电离法(BI),并对3种方法进行了比较分析,其中LSC更利于实际推广。
将近几年针灸治疗乳腺增生的部分文献进行整理,从针刺疗法、针药结合、穴位埋线、穴位贴敷、穴位注射及其他方法等角度进行综合论述说明针灸治疗乳腺增生病疗效显著,而且副作
双排键电子琴的演奏大致可以分为古典风格与流行风格的演奏。这些作品十分丰富,不同的时期,乐曲的风格也不尽相同。为了表现不同风格的作品,必然需要各种各样的演奏手法来实
陈沆是清代中后期的一位的诗人,律赋大家。《陈沆简谱》的编撰力图以一种开阔的眼界展现他求学入仕以及同师友交游的交往活动。同时也尽力梳理陈沆在其所处的时代,其经世致用思
设计了一种以公共电话网作为媒介的电话自动报警系统。该系统分为硬件和软件两大部分。硬件部分以单片机AT89C51为控制核心[1],包括自动拨号、检测和放音等电路。软件部分主
<正>为何事件爆发时才"震惊"?报道"边界"如何把握?缺少调查性报道是当前重要问题。今年两会,昆明"3·01"暴恐事件和马航班机失联事件,引发不少代表委员的关注和讨论。同时,媒
期刊