基于要素图的新闻事件检索技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:borinz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,互联网已与我们的生活密不可分,网民们非常习惯通过网络搜索去了解世界上发生的大小新闻和事件,找到自己关心的信息。然而,飞速发展的技术带来了信息的快速传播以及爆炸式的增长,各类信息也变得越来越碎片化。当人们想对某个感兴趣的新闻事件进行查询,以了解事件完整脉络和演化过程的时候,由于新闻的时效性,各个媒体往往只会在事件出现重要转折或进展时才进行报道,并且大多为介绍当前的事件情况,因此用户需要自己进行多次的查询,阅读多篇相关的文章才有可能了解到事件的前因后果与完整信息,非常不便。不仅如此,当用户想进一步进行拓展阅读,了解更多类似事件的时候,现有的搜索引擎也没有针对事件内容对比的相似事件推荐,因此用户无法通过现有的检索操作获取到整合后的相似事件信息。本文针对新闻事件检索领域的事件信息整合和相似事件推荐两个问题,在对相关文献和研究成果进行梳理后,提出了基于要素图的新闻事件检索模型。该模型先通过将TextRank算法与关键词初次出现位置信息结合,形成TR-F算法进行新闻文档中关键词的提取与处理,利用条件随机场进行文档中地名的识别与抽取,利用新闻发布时间得到了事件的时间信息。接着通过计算事件要素的相似度,进行事件内容聚类形成了事件的要素图,实现了基于时间序列的事件拼图功能,该功能可以将大量的碎片化信息进行有效整合,拼接成完整的事件发展脉络。接着,本文提出了将事件按照时间跨度进行分段的方式,通过将VSM模型与文中提出的分段度量方法进行融合,来计算事件内容方面的相似度,并对BM-25算法进行了改进,以实现查询问题的有效检索,从而可以高效的为用户推荐与目标查询事件相似的其他事件。在此之后,本文通过在真实数据集上进行实验对比与分析,证明了文中所提出的基于要素图的新闻事件检索模型的有效性和可行性。然后在该检索模型的基础上,本文初步设计了基于要素图的新闻事件检索原型系统,并对系统中的各模块进行了功能与实现策略的详细介绍。
其他文献
相较于传统玻璃体切除手术,微创玻璃体切除手术在眼后段疾病治疗中具有优势:在术中可控制平稳的眼内压,降低术中视网膜脉络膜出血、脉络膜脱离的风险,可有效清除基底部玻璃体
在十七年的电影创作中,先后产生过三波"非主流"浪潮。第二波"非主流"出现在提出"双百"方针的1956年,它放弃了第一波的反封建立场,将反对资产阶级和小资产阶级的思想感情作为
本文系统地总结和概括了稀土离子激活碱土铝酸盐长余辉发光材料的研究现状,对铝酸锶长余辉发光材料的超细粉体合成、构效关系及其长余辉发光机理、机械发光与机械猝灭、表面
采用计算机大屏幕或多媒体投影教学有别于传统英语课堂教学模式 ,更不同于“一对一”式多媒体教学。在“一对一”式教学中 ,多媒体和光盘是学生学习语言的工具 ,是一种辅助学
纵向数据在生物、医学和经济学中的研究普遍使用。近年来,对纵向数据各种模型的研究引起国内外统计学者的广泛关注。本文建立了半参数纵向数据的Possion回归模型。并利用极大
目的1.基于构建SLE患者临床数据库的现实需求,设计和开发SLE患者信息登记系统,从而为SLE临床医学研究的提供数据平台。2.应用信息登记系统收集SLE住院患者的临床资料,建立一
分析了影响GPS精度的因素有哪些,野外测量中,如何避免和减小误差的存在,在测量中截断误差的来源;数据采集后对高程进行拟合,遵从怎样的原则选用拟合高程模型,从而在高程拟合
<正>一、实验影响师:今天咱们继续学习——(生齐读课题)再读到这个课题,你的脑海中跳出了什么?生:蝙蝠。生:斯帕拉捷。生:超声波。师:看黑板,谁能将课题和这个词(超声波)用一
为提高自动化集装箱起重机在堆场作业中的叠箱精度,采用基于线激光三角测量法原理的检测系统来检测2个集装箱之间的偏差。在吊具4个锁头附近分别安装1个一字红外线激光器和1
作为解决民族问题的"中国模式",民族区域自治是我国的一项特殊的政治制度,也是我国政治文明建设的重要组成部分。在中国共产党的领导下,民族区域自治一步步走向完善,并成为当