新闻话题事件演变关系自动生成系统的设计和实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:qpowapian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
话题检测与跟踪(TDT)作为一项帮助人们解决信息过载问题的研究,它通过对新闻流中新话题的识别和追踪,将某个话题相关的报道聚集并呈现给用户。但新闻话题的浏览不应该局限于扁平化的报道集,读者更希望看到的是一个个相互联系的新闻事件。新闻话题事件演变关系建模就是一种展现新闻话题的动态方式。本课题以新闻话题事件演变关系建模在现实中应用为目标,研究分析了事件演变关系建模的相关算法和测评结果,得出现有方法还不能够实际应用的结论。   针对相应的问题,作者提出了一种基于类比学习的建模方法,把旧话题的事件模型作为知识,通过类比的方式对同主题的新话题建立事件模型。根据类比学习所应用的建模步骤的不同,建模方法分为分类策略和聚类策略。在测评中,类比学习的建模方法取得了较好的效果。   通过一个完整的事件演变关系自动生成系统的设计和实现,本文具体分析并结合现有互联网资源解决了实际应用中的各种问题,包括新闻搜索的去重和优化、新闻网页的正文提取、跨话题的相似度计算等,从而确定了新闻话题事件演变关系建模在实际应用中的可能。
其他文献
随着Internet技术的广泛应用,家庭网络迅速普及,DSL逐渐发展为宽带接入技术的主流,更多的网络终端设备如机顶盒、家庭网关等被部署到网络中。网络终端设备自身的复杂性和业务
近年来,嵌入式系统的发展非常迅速,多功能的图形化嵌入式手持终端成为一个热点研究领域。由于手持终端通常都是在移动的环境中运行,传统的机械硬盘完全不能满足其需求。而Fla
目前,多媒体在各个领域都有着自己重要的作用,比如说体育事业,新闻事业甚至于到家庭等领域,而多媒体技术的发展更推动了它的推广和使用。这样同时也就产生了数量浩大的视频数
知识处理是信息技术发展的必然趋势,随着对知识应用要求越来越高,传统的知识库系统已经不能满足新的需求。而得益近几年语义网(SemanticWeb)的迅速发展,构建起了一套比较规范的
随着视频监控应用的广泛发展,网络视频监控系统逐渐成为视频监控领域的主流。为了在有限带宽下高效传输符合质量要求的视频图像,联合视频工作组JVT(Joint Vedio Team)在2003
汽车轮毂自动识别系统主要是研究了一种机器视觉系统,这种系统能够识别流水生产线上不同款式、不同型号的多种汽车轮毂。这种识别系统的优势在于:非接触性、在线实时性、高精
在当今信息爆炸的时代,海量数据不断涌现,而且这些数据仍在以每三个月增长一倍的速度持续增长着。因此,如果不借助有效的信息挖掘方法,这些异构海量数据将可能最终变成无人关
近年来,软件的可信性问题再度引起广泛关注,航空、核工业、电信、金融、电力和交通等国家重要领域的信息化程度日益提高,国家基础设施的运转越来越依赖于大型分布式软件系统,
聚类技术是用于数据分析的最常应用的技术之一,其应用领域涉及统计学、计算机科学、生物学以及社会学等。传统的聚类算法如常见的K-means算法,EM算法等都是建立在凸状分布的
随着Internet的飞速发展,网络已经成为对外宣传以及了解世界的窗口。万维网(World Wide Web)为人们提供丰富信息的同时,也留下了用户浏览页面时的大量访问信息。如何利用这些