一种基于主题模型的学术论文推荐方法

来源 :北京大学 | 被引量 : 0次 | 上传用户:aa5518505
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统是一种利用用户与产品之间的相互关系以及相关信息为用户进行个性化推荐的系统。最早出现于二十世纪九十年代中期,用于为用户进行USENET上的新闻推荐。随着逐步的发展成熟,目前推荐技术已经在人们生活的许多方面被采用,特别是在电子商务和在线社交网络领域上。   随着科学研究工作成果的爆炸性积累,对于大学和研究院所的研究人员来说,尽快的找到他们相关领域的重要的学术论文这样一件非常重要的事情变得越来越困难和耗时。学术论文推荐系统能够帮助这些研究者节省时间,尽快的找到最有用的相关论文。目前学术论文的推荐技术受到的关注非常少,相关的研究活动不多,现有的论文推荐方法主要有传统的基于用户之间相似喜好的,也有基于学术论文之间的引用关系的,这些工作都没有对论文本身的主题信息进行挖掘和利用。   本文利用David Blei等人提出的主题模型以及相关的算法对论文自身的主题信息进行了分析,提出了论文之间的主题相似度定义,然后将此定义引入到用户对论文喜好的评价模型中,从而提出了一种新的论文推荐方法。当用户只评价了很少的论文的情况下,与基于用户相似喜好的推荐方法相比,本文提出的推荐方法能够给出更加满意的推荐。实验验证了本文提出的推荐方法的有效性。   本文在文末指出了利用主题模型对学术论文推荐系统可以展开的更多的工作,并指出了基于本文的论文推荐方法的进一步的扩展方向。  
其他文献
目前,推荐系统在各种资源社区以及电子商务网站得以应用,其中最主流的推荐方法便是协同过滤。但迄今为止,没有任何方法能很好的适应任何的数据集合。针对特定的数据集,人们往往根
现代信息技术高速发展,知识和科技领域的革新重组了人们的生活、交流与学习方式,越来越多的人开始使用互联网,各种背景和身份的人通过网络获取以及发布自己的信息。BBS、阅读
随着人们对搜索的效率和准确性的要求不断提高,单一的搜索引擎已经不能满足很多用户的需要,有时为了搜索一个内容而要查找几个独立的搜索引擎,为了解决这个问题,元搜索引擎出
数控技术的迅猛发展,对数控系统中的整个运动控制核心的机床逻辑控制提出了越来越高的要求,而其逻辑控制是由可编程控制器(PLC)来实现的。PLC程序是使数控机床的各部件有效可靠工作的关键部分,因此PLC编程工具是数控系统中必不可少的部分。蓝天数控系统原由PLC编程语言是SIPROM语言,一种文本化编程语言。本文正是针对蓝天数控系统对PLC梯形图与SIPROM语言相互转换进行研究与实现,实现图形化编程及
数据交换与集成旨在解决分布式异构系统间数据交互和信息共享的应用需求。信息化的实践证明,大型信息系统的建设一般都需要相当长的过程,这其间由于需求变化、技术发展和人为因
无线传感器网络(Wireless Sensor Networks,WSN)是一种综合了计算机、微电子与通讯等多种学科研究内容的新兴的网络技术。它通常是由大量廉价的具有信息获取能力的节点组成自
候鸟迁徙行为过程主要中涉及到栖息地发现、迁徙路线追踪以及栖息地之间的活动关系等。如何寻找候鸟迁徙过程的栖息地、追踪候鸟的迁徙路线、挖掘栖息地之间的强关联关系对候
信息时代互联网的繁盛极大地丰富了人们获取信息的途径,网上聊天、网络购物、网上办公已经成为人们日常生活中不可缺少的一部分。然而随着互联网的爆炸式增长以及海量信息的涌
DNS(Domain Name System,域名系统)[1][2]是重要的互联网基础设施,主要功能是将主机名映射为IP地址。DNS协议自身的安全缺陷使得它面临很多安全威胁。为了弥补DNS协议缺陷并抵
自从世界上首例手机病毒“VBS.TimoFonica”于2000年6月发现以来,移动终端恶意代码的数量在不断的增加,危害性不断增强。目前移动终端恶意代码发作时,能够破坏系统软硬件设备