基于超图分割的共指消解研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:djxhh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
所谓共指消解就是将对应同一实体的多个表述划分到一个等价类的过程。共指消解是信息抽取中的一个重要子任务,在自然语言处理和信息检索的各个领域有着重要的应用。传统方法将共指消解分割成为两个步骤:1)分类的过程2)合并的过程。在本文,我们利用超图分割巧妙解决共指消解问题,避免了将共指消解分割成为两个过程,而是从全局优化的角度,一步解决共指消解。我们利用超图表示一篇文本,顶点代表表述,超边多个代表表述共同具备的特征,共指消解就是从全局优化的角度,将超图分割成多个独立的子图,每个子图代表一条共指链。本文重点研究了三部分的内容:共指消解的超图建模;共指消解的超图分割;无标注语料的超边权重学习。共指消解的超图建模主要集中在利用超图对共指消解进行建模,包含超边和超边权重的确定。我们引入了负连接,强连接两种超边的概念,刻画实体之间的联系。我们提出了绝对超边权重学习和加权超边权重学习,来确定超边的权重。共指消解的超图分割主要是将共指消解转化为超图分割的过程,我们分别从k路超图分割和迭代2路超图分割两个角度来解决共指消解问题。k路超图分割优化对超图的切割损失,通过求解超图分割的子图数确定共指链数。迭代2路分割优化对超图分割的容忍度,逐步分割子图,确定共指链。在ACE05中文语料上,和传统方法的比较证明了我们工作的有效性。在无标注文本的超边权重学习中,我们利用无标注的文本自动学习超边权重,将有指导的超图分割转化为无指导超图分割问题。我们分别提出了利用核心词匹配的方法和基于词关联度的方法。词关联度是有效的共指特征,受限于稀疏性和计算复杂度,词关联没能有效应用在共指消解中,本文通过巧妙的转化,利用词关联的信息学习超边的权重。实验结果表明,我们的方法具备媲美有指导的方法,并具备较好的移植性。
其他文献
参数估计是现代信号处理的一个重要的研究方向,并且在雷达、声纳、生物医学、通信等领域有着广泛的应用,因而对参数估计方法的研究有着重要的理论和应用价值。本文针对高斯白噪
近年来关于软件定义网络(Software Defined Network,SDN)的研究已成为未来网络的热点课题。控制平面负载均衡研究作为SDN中一项基础而又重要的课题,旨在有效提高控制平面可扩
群体行为分析与理解作为一个复杂、多样、具有挑战的领域近年来吸引了很多研究机构的关注。在视频监控、人机交互、多媒体内容理解等方面,群体行为分析都是重要的组成部分之一
随着现代社会中的运输服务市场的不断发展和扩大,并在现代商业中占有重要地位。各运输公司均需要一些软件来实现运输,需求和客户的管理。本文主要目标是创建一个结合运输管理
纸币图像分析的目的就是通过对纸币图像进行分析和理解,来高可靠性的对纸币进行分类、有效的检测出纸币的真伪、新旧和残缺,保证市场上流通纸币的安全性和整洁性。很多国家对市
随着人们在日常生活中对计算机软件的需求不断增长,计算机软件系统的规模和复杂度也在不断的攀升,而对大规模复杂系统的测试和维护等需求超出了目前的测试与维护技术,因此也就出
随着互联网的迅速发展,网络规模急剧增大,结构日趋复杂,大规模网络已经成为网络研究的热点。网络模拟能够研究复杂网络行为,评价尚未实施的网络协议,具有成本低,易使用、模拟真实性
随着互联网的迅速发展,各行业信息化程度不断提高,越来越多的信息积累在网络上,如何在浩瀚的信息中寻找到有用的信息,一直是领域研究的热点。本文的研究背景是陕西省教育厅专项科
随着论坛等互联网社区的蓬勃发展,越来越多用户参与到互联网的建设中来,向互联网贡献数据。这些数据中很大一部分是对人物和事件的评论,包含了用户的观点和态度。浏览这些信息能
近年来,基因调控网络一直是一个生物信息学中的热点问题。基因调控网络描述的是基因之间的相互调控关系,通过分析该网络,可以从中发现基因之间相互作用和协同工作的原理,并且