基于改进的SingIe-Pass算法微博话题发现

来源 :现代计算机 | 被引量 : 0次 | 上传用户：woaihoujian

【摘要】

：

详细介绍传统的Single-Pass算法并分析它的特点和不足之处，并针对传统的Single-Pass算法对输入顺序敏感的问题，提出一种改进方法，即找出含有话题信息丰富的微博客文本优先聚类，得

【作者】

：

陈龙稳

【机构】

：

四川大学计算机学院,成都,610065

【出处】

：

现代计算机

【发表日期】

：

2016年29期

【关键词】

：

WeiBo Single-Pass Topics Clustering

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

详细介绍传统的Single-Pass算法并分析它的特点和不足之处，并针对传统的Single-Pass算法对输入顺序敏感的问题，提出一种改进方法，即找出含有话题信息丰富的微博客文本优先聚类，得到初始的话题簇，再对余下的微博客文本进行聚类以提高聚类的精度。对话题发现的流程：文本预处理、向量模型的构建、Single-Pass聚类、凝聚层次聚类进行详细的描述，实验结果表明该方法在召回率、准确率、F值指标上均优于传统的方法。“,”Introduces the traditional Single-Pass algorithm in details and analyses its characteristics and disadvantages, and in view of the traditional Single-Pass algorithm is sensitive to the problem of input sequence. In order to solve the problem and improve the accuracy of clustering, proposes an improved method, namely, identifies the topic information rich microblog text to cluster to get the initial cluster result, then clusters the rest of the micro blog text. Topic discovery process:text pretreatment, vector model build, Single-Pass algorithm, hierarchical clustering algorithm has carried on the detailed description. The test shows that the method on the recall ratio and accuracy, F value in-dex is superior to the traditional method.

其他文献

Al-5Ti-1B-4Sr中间合金对Al-8Si合金同时细化和变质效果

采用氟盐法和对掺法成功制备了Al-5Ti-1B-4Sr中间合金,采用X射线衍射(XRD)和扫描电镜(SEM)分析了Al-5Ti-1B-4Sr中间合金的组织及相组成。通过改变Al-5Ti-1B-4Sr中间合金细化

期刊

refinementmodificationmaster alloyhypoeutectic Al-Si alloy

北魏时期佛教文化的身份认同功能研究

魏晋时期是中华文明历史发展长河中的一朵奇葩，这朵奇葩是在血泪的浇灌中，忍受着剧痛的折磨，努力茁壮成长，最终绽放出了古代史上最辉煌的篇章。因而，魏晋时期对于华夏而言，是一个裂

学位

北魏时期佛教文化身份认同民族文化精神信仰

ZPW-2000A无绝缘移频轨道电路监测系统

针对ZPW-2000A无绝缘移频轨道电路的系统结构和技术特点,提出一套切实可行的监测与维护解决方案.

期刊

技术条件完全隔离双频信号现场总线数据信号处理

上海市种子生产经营备案管理工作现状及对策

种子生产经营备案制度是《中华人民共和国种子法》(以下简称《种子法》)中的一项重要制度,是做好种子监管工作的重要抓手.上海市农业主管部门及种子管理部门高度重视种子生产

期刊

鹌鹑新城疫防制方法,肉鸡三段饲养法,兔粪与兔病,3则

该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥

期刊

鹌鹑新城疫防制方法肉鸡饲养

新一轮盈利泡沫

免费邮箱要改收费邮箱,免费个人主页要改成收费,手机短信息的钱要一分一分地收一几乎一夜之间,所有的网络公司都开始强调“盈利”.

期刊

盈利手机短信息收费邮箱免费邮箱个人主页网络分地

论劳动中的情感因素

劳动是人类及其社会存在和发展的基础,它是人的“自由的有意识的活动”。劳动是主观与客观的统一,是人的本质力量的对象化。情感是人的重要的精神活动,人类的任何活动都蕴含

学位

劳动情感情感关怀体面劳动和谐劳动关系

当代“穿越”审美意识研究——以现代“穿越影视作品”为例

传统美学往往将审美与艺术相互交织在一起，熔审美与艺术为一炉。在传统美学看来，最集中、最典型的审美活动，应该是各类各式的艺术。就本质而言，艺术就是理想与现实的特殊结晶，所以

学位

传统美学“穿越现象”影视作品审美意识

当代日常生活之“立美”研究

日常生活本是人们生长、生存、生活的活动世界。日常生活正因为是人们活动世界必不可少的活动，反而人们逐渐对生活世界的内涵以及社会功能有所忽略。在社会现代化进程中，西方国

学位

日常生活立美立美宜人人的全面自由发展

天然植物饲料添加剂管理浅谈

期刊

天然植物饲料添加剂管理畜牧水产养殖占据市场生产企业新品种影响力原料应用开发

基于改进的SingIe-Pass算法微博话题发现

与本文相关的学术论文