论文部分内容阅读
微博突发话题的检测是网络舆情分析的一个重要分支,如何实时高效地发现微博文本流中的突发话题是目前亟待解决的问题。为此提出一种基于动态窗口的微博突发话题检测方法。将词对加速度作为突发特征,根据微博文本流中突发词对出现的速度自适应地确定突发话题窗口范围,并利用改进的非负矩阵分解聚类方法获取突发话题窗口中微博的主题结构。在微博文本流上的对比实验表明,该检测方法不但可以减少突发话题检测的时间延迟,而且能够提高检测的准确率和召回率。