中文人名跨文档指代消解研究

被引量 : 0次 | 上传用户:wlp00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文人名跨文档指代消解的主要任务是判断不同中文文章中某个人名是否为同一人物的过程。它在自然语言处理中有着重要作用和特殊地位,是信息检索、信息抽取、多文档摘要等应用系统的重要组成部分。其完整的过程可分解为两大部分:单文档的共指消解和实体聚类。目前,对跨文档指代消解的研究重点在于不同文档中同名实体的聚类。本文在探讨和分析中文人名跨文档指代消解的主要任务和研究重点的基础上,着重进行了以下几个方面的工作:首先,本文针对中文人名跨文档指代消解的重要前驱步骤——中文人名识别进行研究和实验,采用人名可信度、人名区分度和边界模板可信度的综合概率作为可信度模型,对文本中的待消解查询人名进行识别和判断。其次,本文基于向量空间模型将文本中待消解实体转换为向量,通过对向量之间的相似度反映文章中人物的相似程度。本文在进行向量空间表示时,根据人物特性进行了预先分类,之后按照不同类别采用不同特征来表示文章中的实体,使得实体的向量转换更为准确。最后,本文采用单链接的凝聚层次聚类方法将同名的不同实体通过聚类将其消解,通过对其中存在的问题进行分析和讨论,提出了解决这些问题的方法,并进行了实验。
其他文献
一部中国近代史,是中国人民饱受列强侵略凌辱的历史,同时也是中华民族自强不息、抵抗外侮的牺牲奋斗史。120年前,中日两国之间进行了一场足以改变两国历史走向的战争——甲午
<正>《红楼梦》和《战争与和平》这两部代表着世界文学作品中最高成就的文学著作,是人们百读不厌的好书。它们都叙写了封建时代的四大贵族家庭的生活与命运(《红楼梦》中是贾
在储层预测研究中,当储层与泥岩波阻抗差异不明显时,常规地震反演方法不能有效预测储层,无法满足精细储层预测的要求。针对南海M油田储层预测实例,通过分析测井曲线储层识别
<正>随着我国经济的增长,人民群众生活水平提高,对医疗卫生服务的需求日益增加。当人们到医院治疗疾病时,希望能得到医院全方位的治疗和舒适的护理。当前,因为医患与护患矛盾
随着以信息技术为核心的知识经济时代的到来,技术创新已经成为企业竞争和国民经济发展的首要手段。技术创新能帮助企业实现可持续发展、提高核心竞争力,而且对国民经济的发展
车辆轨迹识别与在线异常检测是智能交通系统中的一个重要研究方向,它对现实生活中发生的交通事故及时有效地救援和后期处理具有很大的辅助作用;同时它能减少因为交通事故引起
时间信息是一个非常重要的物理参量,随着现代科学技术的发展,通信、电力、导航、武器试验等诸多领域都对高精度授时、校时提出了要求。在水声学试验中,往往需要高精度的时间
自发现转录因子7类似物2(TCF7L2)基因多态性与成人2型糖尿病(T2DM)相关以来,该结论在不同人种中得到广泛证实,T2DM在我国汉族人发病率和患病率逐年升高。同样近年来,妊娠期糖
近年铁路快速发展,而铁路线路设计是铁路建设的基础性工作,随着线路CAD技术和计算机技术的发展和日趋完善,数字地面模型技术也得到很大发展。数字地面模型作为线路设计现代化
随着新课程改革的深入以及教学理念的创新,教学模式发生了巨大变化,这是时代发展的要求。"翻转课堂"教学模式是一种新型的教学模式,对高中化学教师来说既是挑战也是机遇。化