论文部分内容阅读
近年来,随着互联网技术的发展,人们通过社交网络彼此联系越来越紧密。微博,Twitter等工具的出现使得人们了解世界的方式变得越来越容易。社交媒体平台每天产生着大量的消息,这些消息包含了大量的事件信息。利用话题检测与追踪技术对社交网络事件进行分析、追踪事件的演化过程对于把握事件的发展动态具有重要意义。事件演化分析是话题检测与追踪技术的一个方面,主要研究话题下的事件演化过程。本文将研究Twitter中事件之间的演化关系。传统的事件演化分析方法大多先根据事件的发生时间来确定事件之间的时序关系,然后计算事件关联度得到事件演化图。在实际中,事件可能存在噪声,导致事件发生时间的估计不够准确,影响事件演化图的质量,进而影响后续的事件演化追踪。针对上述问题,本文在已有的研究基础上提出了事件演化分析新方法,包括如下几个方面:(1)提出了基于动态时间规整算法的事件时序关系分析方法。该方法针对社交网络事件中可能存在的噪声,首先采用时间与空间信息融合的方式,通过核密度估计方法对事件的时间序列进行去噪;然后,使用动态时间规整算法获取去噪后的两个事件的时间对齐关系;最后,对事件的时序关系进行判决。实验证明,本文提出的方法能够有效的得到事件之间的时序关系。(2)提出了基于时间划分的事件演化追踪方法。该方法针对事件演化图中的演化过程追踪问题,首先,将事件按照时间窗口进行划分,形成多个阶段的事件;接着,对相邻阶段的事件构建带权的有向边生成事件演化图;最后,根据目标事件的不同,使用维特比算法求解最优路径,将多条演化路径组织成一棵或者多棵演化树,作为事件演化过程的估计。实验表明,本文方法能够对事件的演化过程进行有效的追踪。