基于潜在语义分析的微博主题挖掘模型研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:gomo08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Alloca-tion)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。
其他文献
课堂对话对于教师要求不是降低了,而是提高了。教师如果不能随机应变,把自己的问题有序地层层深入组织起来,把学生的问题,哪怕是看来无理的问题引向深层,就很难驾驭课堂。不
以人的需求为基础进行化学创造或发明的"按需设计"是化学推动人类文明进步的重要方式。通过创设"按需设计"的教学情境,渗透化学史中的科学发展观,可以引导学生感受到以人为本
本论文将上海院前急救医疗资源配置问题作为研究主题,以定性研究和定量研究为两翼,研究了院前急救医疗服务的相关理论、主要模式、上海院前急救医疗服务的供需现状和急救网络优
<正>6月13日,省政府督查组来我厅督查贯彻落实国务院稳增长、促改革、调结构、惠民生政策措施情况。国务院重点督查的稳增长、促改革、调结构、惠民生各项政策措施中,由我厅
本文对恩施玉露茶连续化加工过程主要茶叶品质化学成分的动态变化进行分析。结果表明,随着加工过程的进行,茶氨酸、茶多酚、可溶性糖及叶绿素含量先升高后降低,在精揉阶段达
目的观察心内科护理人员心理健康、职业倦怠状况及应对方式,为提出改善心内科护理工作压力的建议提供依据。方法选取两医院心血管内科的护理人员48名(心内组)及其他内科护理
<正>工程财务工作是企业经营管理的重要环节之一,其中工程"两算"管理又是工程财务工作的重中之重,加强工程"两算"管理对于控制工程造价、规范工程资金管理、发挥投资效益起到
目的:初步探讨中药干预治疗乳腺癌化疗患者便秘的临床疗效。方法:选择本科行TEC方案乳腺癌化疗患者40例,随机分为治疗组和对照组。治疗组化疗前1日予中药口服,每日1剂,7日为1
当前,药品安全作为重要的公共安全组成部分,已被我国党和政府提到影响国家安全的高度。药品安全是满足人的生存权、健康权的基本要求,在提倡“以人为本”,建设和谐社会的当下