面向话题的事件信息融合研究与实现

来源 :苏州大学 | 被引量 : 0次 | 上传用户:tanhuanghehuanggua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件信息抽取(Events Information Extraction: Events IE)目前是信息抽取(Information Extraction: IE)中的一个重要领域。本文提出了一种跨文本事件信息融合方法,该方法在事件IE的基础上引入了多源信息融合理论,并结合命名实体识别、指代消解等其它信息抽取技术,对多源、多文本同话题事件进行信息融合。本文的主要内容包括元事件融合和话题事件融合两部分,具体内容如下:1.在元事件融合中,考虑到自然语言表述的多样性,对事件描述中的事件元素进行规格化处理,并针对事件元素中的时间信息、命名实体和数字信息的不同表述特点,采用不同的规格化方法;2.在共指元事件聚类过程中,由于事件描述中常出现事件元素的缺失,为了提高共指元事件聚类的召回率,提出了关键元素集合的概念。并针对事件信息的特点,利用事件中的语义和语用信息提出一种适用于事件信息的相似度算法;3.在事件元素融合时,在元素的基本可信度上,针对各类事件元素的不同表述特点,根据元素的精度和准度不同调整元素的可信度,提高精度高的元素值被选中的概率。在元素选择时,在可信度计算的基础上,采用了投票策略,增加了最后结果的可信度;4.在话题事件融合中,为了能更好地表示话题型事件,本文定义了一种基于元事件的话题事件表示模型(Event-based Topic Description Model: ETDM)。该模型可有效地将话题事件进行结构化和层次化表示,接近人类的认知模式,同时可根据不同需要进行信息定制。最后给出了话题事件的融合方法。实验表明,本文元事件融合可以有效合并事件信息,大大降低了信息系统的冗余度,完善了单个事件信息,通过对多源信息的冗余性和互补性进行融合,达到增加目标特征矢量的维数,降低信息的不确定性,改善信息的置信度等目的。对话题事件的融合不仅能有效地将相关事件联系起来,并能将整个话题以层次化、结构的形式表示。
其他文献
视觉导航是智能车辆导航的一项关键技术,本文针对智能车辆视觉导航系统的研究,提出了基于运动车辆建模与跟踪技术研究这一课题。论文首先介绍了课题的研究背景、研究意义、当
随着信息共享的普及,各种应用软件相继出现。软件功能越来越多样,代码的控制结构也越来越复杂。随之而来的安全问题也引起社会各方面的广泛关注。为了维护信息系统的安全,高
近年来,门户系统(网站)建设已经成为一种趋势,具有长远眼光的企业纷纷开始建设自己的企业门户。但门户系统的建设是一项覆盖面广的、大型复杂的系统工程,它与传统的公共信息
网格(Grid)技术是近年来国际上兴起的一种重要信息技术,其目的是实现地理上广泛分布的大量异构资源的共享。资源调度是网格研究的重要内容之一,它决定了如何合理地将任务分配
曲线曲面的拟合问题在理论研究和实际应用中常常遇到。模式识别和计算机视觉中,图形(图像)数据的模型拟合是一项基本的工作。在工程、统计和计算机图形等方面也有着广泛的应用
传统的粗糙集理论是一种处理不完备、不完整数据的智能计算方法。传统的模糊集理论也是一种重要的处理不精确,不确定信息的数学工具。模糊粗糙集是模糊集理论和粗糙集理论的
随着Internet的发展,网络资源作为一种新兴的资源正快速增长。网络资源广义上可包括电子文档、电子视频、网络信息、应用程序、网络服务等,对于部分可复制的网络资源,如电子
随着数据库技术的不断发展和其在军事、政府、金融等部门的广泛应用,数据库的安全问题越来越受到人们的高度重视。传统数据库系统提供的安全特性仅能够满足一般的应用要求而
在优先考虑工程安全,供电可靠性的条件下,梯级水库水电站的优化调度,充分发挥水资源系统的除害兴利作用,使总体经济效益最大。梯级水库调度问题是一个复杂的问题,正确、合理
近几年,关于神经网络的研究取得了令人瞩目的进展,引起了包括计算机科学、脑神经科学、人工智能等学科领域内的科学家的巨大热情和广泛兴趣。神经网络是人类对其大脑信息处理