基于LDA的微博个性化新闻推荐方法研究

来源 :武汉邮电科学研究院 | 被引量 : 3次 | 上传用户:cutuf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,微博由于其开放性,实时性,丰富性吸引了大量的用户参与其中,这必然使得微博数据量呈现爆炸式增长,为用户快速获取所需要的信息造成了严重的负担。因此,如何快速有效地为用户推荐有用的信息存在一定的必要性,其中最关键的问题是如何挖掘用户的个性化兴趣,为一个良好的个性化推荐系统提供坚实的基础。本文分析和研究了微博用户兴趣建模问题,主要研究成果如下:(1)针对微博中噪音数据多和短文本的的问题,提出了一种基于联合分类器的噪音微博过滤方法,和利用用户基本信息、评论转发信息等扩展语义信息的微博内容扩充方法。(2)提出了一种基于词对共现的改进LDA模型用于微博短文本的主题分析,以克服传统LDA对短文本进行主题建模时,因文本向量稀疏性造成的同一主题下词条间关联度不高的问题。(3)分析用户兴趣时,一方面基于用户的历史微博数据进行分析,另一方面基于用户关注者或粉丝的微博内容进行分析。并利用时间将分析获得的主题特征划分为用户长期、短期和过去三种兴趣,保留长期和近期兴趣用于兴趣建模。(4)设计对比实验以验证方法的有效性,实验结果表明,基于词对的改进LDA模型在分析微博短文本时有很好的效果,且结合的兴趣特征能够扩展用户的兴趣,为用户推荐更丰富的信息。
其他文献
在高职数学教学中引导学生探索思考、培养质疑精神和创新能力的途径是:巧创情境,激发学生探索知识的兴趣;设计提问,启发学生自主思考;鼓励学生提问,培养质疑精神;善于引导,掌
阐述了油脂加工企业环境污染主要反映在废水、废气、废物及噪声四个方面,介绍了我国油脂工业在环境保护方面已取得的技术进步,提出尚待解决的问题以及采取的环保措施。
目的通过运用PDCA循环法对检验科凝血检查室内质量控制水平进行持续改进。方法 将检验科凝血检查室内质量控制的管理过程按PDCA循环法分为P(Plan计划阶段)、D(Do实施阶段)、C(Chec
我没有特别的成绩,仅仅是在上级领导和同志们的支持下做了一些工作。我信守这样的座右铭,做到立党为公,必须从严执纪;体现执政为民,必须关心群众。因此我用自己的一切来回报党和人
针对桥梁伸缩缝处的跳车现象,介绍了其表现形式及危害,分析了其形成的原因,并提出了有效预防及处治措施,从而进一步巩固和提高公路工程质量水平。
【正】 党的十六大报告明确提出“以开放促改革促发展”,这标志着我党对开放作用的认识进一步深化,必将更加坚定我们对外开放的信心和以开放解决改革问题、发展问题的信心。
介绍了防火卷闸门的控制要求,对控制器的原理设计作了分析,并对其软件设计进行了阐述,经在实践中使用证明,将单片机用于防火卷闸门控制器中是一种经济可行的办法.
阐述了框架剪力墙结构体系的概念,介绍了采用双肢墙理论计算框架剪力墙结构在水平荷载作用下的侧移,经实践证明,该方法简便快捷,可供类似结构计算借鉴.
在我国经济增速换档、发展方式和发展动力转变的新常态下,金融脱媒化、利率市场化以及金融科技的飞速发展导致商业银行传统利息业务的利润空间大幅缩小。迫于压力,我国银行业
面对空前繁荣、潜力巨大的中国冷藏车市场,作为冷藏车设计者,我们急需一套行之有效的车型选择标准,使得我们的产品既能满足客户的真实需求,又能保证产品符合国家标准、本文将