基于实时词共现网络的微博话题发现

来源 :计算机应用 | 被引量 : 0次 | 上传用户:bbaaccd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对微博的实时性、稀疏性和海量性特点,提出基于实时词共现网络的话题发现模型。首先,从原始语料中筛选出主题词集合,再利用时间参数计算共现主题词的关系权重以实现词共现网络的构建,通过该网络推算出与话题关联性强的潜在特征词以解决微博特征词的稀疏性;其次,采用改进Single-Pass算法实现话题增量聚类;最后,对每个话题的主题词按热度计算进行排序,获得最具代表性的话题主题词。实验结果表明,该模型与经典Single-Pass聚类算法相比,话题发现准确率约提高6%,综合指标提高8%。实验结果证明所提模型的有效性和准
其他文献
此次“丝路方舟”面塑作品的创作,我以公元前119年张骞第二次出使西域,以致西域各族政权派代表随汉使到汉朝答谢为背景,让人民群众通过一组波澜壮阔、可歌可泣的古丝绸之路面
在本科阶段,概率论与数理统计是大多数专业的一门很重要的基础课,实用性很强的课程,但在我国现行的教学中没有足够重视这门学科的实用性.本文通过举出几个典型的例子,阐述如
文章在分析电子设备电源系统传导干扰产生机理的基础上,阐述电源线滤波器在电子设备EMC抗干扰设计中的作用及应用分析。并结合试验测试数据,来分析滤波控制技术在电子设备抗
种子密钥是高级加密标准(AES)的关键参量,而密钥扩展算法则是保护种子密钥不被盗取的重要实现方法。首先对加密算法的实现方法与过程进行研究,然后详细分析密钥扩展算法的运算
我国是一个多民族国家,民族经济的发展关系到国家富强、人民富裕。民族经济立法不但关系到民族地区的根本经济利益,更关系到社会主义市场经济条件下的法制建设。改革开放以来
目前流行的翻译理论和对于译作的评介都着眼于原文和译文的对比分析上,较少有人注意翻译行为的另一个度向,即翻译对译入语的影响甚至改造。然而翻译史上一直有大家把改造或重
本文对环境审计的现状进行了分析,指出研究环境审计目标的重要性,同时,对环境审计目标的特点和体系进行了分析,并在此基础上对循环经济下环境审计目标进行了探讨。
以超星学习通为工具,有机化学教研组在药学专业有机化学教学过程中自然构建信息化教学课堂,让学生通过教师课堂讲授以外的慕课、网络、多媒体等信息化软件拓展知识面,刺激和
目的探讨乳腺癌术后并发肩关节功能障碍的危险因素,构建乳腺癌术后肩关节功能障碍风险预测模型。方法便利选择230例乳腺癌术后患者,用一般资料问卷收集患者的一般人口学特征