面向微博的事件摘要生成算法研究与实现

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:anjo888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微博类应用的风靡,用户在微博平台上产生的数据在每时每刻地快速增长,搜索引擎虽然能够根据用户输入的事件关键词从海量的数据中返回相关微博,但大量的微博数据,加之微博信息碎片化的特点,用户很容易淹没在搜索引擎返回的信息流中。如何帮助用户快速了解到事件在发展过程中的要点信息,成为亟待解决的一个问题。本文针对信息过载的问题,结合微博的短文本特性和社会化特征,提出一个微博场景下的事件摘要方案,为事件生成时间轴摘要。围绕微博事件摘要的关键技术,本文主要内容如下:第一,提出一种基于关键词共现词图的子事件检测算法。针对事件相关的微博文档集合,该算法利用关键词在文档中的共现关系构建词图,通过社区检测的算法划分关键词社区,每一个社区作为一个子事件,以社区中的关键词作为子事件特征实现子事件文档聚类。实验结果表明该算法能够较有效的检测出主要的子事件,能为后续摘要提供高质量输入。第二,提出一种微博事件摘要生成算法。该算法通过突发性估计检测出事件的重要时间点,对重要时间点上的微博集合应用所提出的子事件检测算法,并对检测出的子事件进行重要度排序,从重要度高的子事件中选取评分高的微博生成摘要。在这一过程中,我们分析了微博社会化特征对于微博消息重要度的影响,提出一种子事件重要度评估方法,以及一种融合社会关注度和子事件概括程度的微博评分方法。实验结果表明,该算法生成的摘要取得了较好的效果。第三,根据所提出算法实现了一个微博事件摘要系统,该系统生成的时间轴摘要内容充实,要点全面,有助于用户理解事件。
其他文献
随着网络规模的不断扩大和各种复杂业务的应用,如何有效获得网络状态信息对优化网络设置加强网络管理、提高网络服务质量和确保网络安全至关重要。网络测量是获取网络状态信
近年来,网络安全作为一个严肃的问题呈现在人们面前。入侵检测技术是一种与防火墙不同的动态防御技术,是继防火墙技术之后的最重要的网络安全保障技术。因此研究入侵检测具有
制造业物联网的网络特性复杂多变,体现在制造业中存在有线、无线网络,各类传感器、驱动器、感知节点以及执行节点并存。其中感知节点随着制造业环境的不同而动态变化、信道可
随着移动互联网、自媒体、社交网络的快速发展,互联网出现了“信息过载”问题。作为搜索引擎之后一个革命性的技术,推荐系统以其能发现用户潜在需求、提高人们选择和筛选物品
随着计算机技术的高速发展,计算机与信号处理相结合的音频修复技术在音频修复与数字化保存产业得到逐步推广。我国数字化、信息化进程的不断推进,各类图书馆、博物馆和档案馆
随着互联网络的飞速发展,给网络系统的正常运行带来了一系列的问题,其中最突出的就是由于网络带宽资源没有得到有效管理导致网络性能降低。与此同时,网络中不同业务流对资源
近来,处理器设计、内存和无线通信技术的进步激发了研究者们对分布式传感网络的关注,在分布式传感网络中,由若干相互独立且具有自我维护能力的结点相互协作现实信息收集和实时处
随着计算机技术和网络技术的迅猛发展,信息系统不断朝着集成化、智能化、网络化与分布式的方向发展,传统MIS系统开发模式的缺陷逐渐暴露出来,限于开发周期和成本、人员调配上
随着信息科学技术的高速发展,人们对海量信息存储的需求日益增长。CPU的处理速度和存储设备I/O处理速度之间的差距越来越大,为了弥补这种处理速度的差异,在磁盘阵列中加入Cac
随着计算机技术和Internet的飞速发展,网络信息安全问题逐渐成为维护国家安全和社会稳定的一个焦点。入侵检测系统(Intrusion Detection System, IDS)应运而生,它通过对计算