一种基于用户聚合的双词主题模型及其在短文本推荐中的应用研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:chloexg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网与智能移动设备的快速发展,以Twitter,微博等为代表的社交媒体应用变得越来越受欢迎,个人网站,博客,社交网站等应用每天会产生大量的信息,导致了严重的信息过载问题,用户很难在大量产生的信息中找到自己感兴趣的内容。文本推荐,可针对不同用户的具体情况给用户推荐满足其喜好的文本信息,成为了解决信息过载问题的有效途径。传统的文本研究方法主要集中于长文本,无法很好地适用于这类短文本的情境。为了在大量产生的信息中找到用户感兴趣的内容,我们分析了社交媒体应用中产生的信息的特殊性,提出了一种基于用户聚合的双词主题模型,能够有效分析短文本主题且进行推荐。本文的具体贡献如下:1.提出了一个基于主题模型的短文本推荐框架,利用用户聚合的双词主题模型,既解决了用户偏好获取的问题,又较好地解决了新文本的主题分析问题,并利用用户偏好与文本主题相似性来实现个性化的排序。2.提出基于用户聚合的双词主题模型UBTM,能够有效获取用户偏好和单词的主题分布,达到短文本主题分析的目的。同时提出了基于Gibbs采样的UBTM模型参数估计办法,并给出短文本主题的推断方案。3.提出了一个短文本推荐系统,利用UBTM技术从用户转发或者发表的文本中获得用户偏好和短文本主题分布,最终从新文本中对用户进行TopN推荐。我们在微博和Twitter的真实数据集上进行实验,定性和定量地证明了UBTM模型具有更好的推荐效果。4.最后我们实现了一个微博原型推荐系统,初步验证了上述技术和方法的合理性。
其他文献
自21世纪以来中国经济迅速发展,大额支付系统的上线满足了中国经济国情。金融机构不断壮大以及它们之间业务量的不断剧增使得一个具有低流动性风险、高支付结算效率的大额支付
本文主要研究面向对象建模技术,并对面向对象建模语言UML进行了探讨,介绍了UML建模过程。阐述了模拟简单计算机系统的设计方案,并在模拟简单计算机系统的建模过程中应用UML建模
该文论述了一个公安业务处理、档案管理和办公自动化相结合的公安数字档案系统设计方案,为未来公安内部管理信息系统全面解决方案提供了基础.该方案突破传统的客户/服务器结
该文主要对系统中的以下几个关键问题进行了探讨:1、该文对移动漫游话单的几种数据分发的方式进行了探讨.考虑到网络阻塞的现状和系统实时性的要求,该文提出了缓冲池的概念,
随着互联网的高速发展,大数据(Big data)吸引了各领域越来越多的关注。实际应用中的复杂高维数据,不仅对于计算复杂度和空间复杂度产生很高的要求,还会产生维数灾难(the curs
在三维编织复合材料预制件的研制和生产过程中,需要测量和分析材料的工艺参数。研制开发一套测量系统,实现准确、快捷地对三维编织复合材料的预制件进行厚度测量,对复合材料的质
该文从理论上介绍GSM网络性能管理的原理及概念,根据GSM网络维护及优化的需要,提出开发性能管理系统的目的和任务.结合中国GSM性能管理网网路组织,针对长沙地区目前GSM网络的
工程数据表是在工程规范、设计手册中大量应用的,用来表示数据之间关系,展示设计原理等最常用的方法,也是知识表示的常用方法.现有人工智能方面的成果对工程数据表的表示有一
本文系统介绍了江苏省高速公路收费系统设计及控制软件实现。探讨了当前流行的分布式计算模型以及分布式数据库的实现途径。有两种分布式数据库实现途径:(1)分布式事务;(2)复制。这
山东省公众多媒体通信网使用INTERNET的技术,可向社会公众提供INTERNET的所有服务.在山东省公式多媒体通信网内,该文采用OSPF的路由协议,设计了全网的路由策略.利用OSPF的度