论文部分内容阅读
互联网的出现和普及带来了海量的数据,这就使得用户在面对海量信息的时候很难从中找到自己最需要的那部分,因此海量信息带来了信息利用率急速下降的问题,这就是所谓的信息超载问题。推荐系统就在这个背景下而产生的,它主要是根据用户的兴趣和特点,向用户推荐其最可能感兴趣的信息或者商品,从而解决信息超载的问题。推荐系统是比搜索引擎更加智能的系统,它的基础是海量数据挖掘。推荐系统近年来已经成为学术界的一个研究的热点,因为推荐系统可以很好的解决信息超载问题,已经被广泛的应用于很多领域,并且已经在工业界取得了许多成功的应用。业务系统的许多信息(用户元数据、产品元数据、协同相似性、用户反馈以及网络关系信息等等)都是对推荐有用的信息。传统的推荐方法,包括基于内容的推荐、协同过滤、基于社会网络的推荐和混合推荐,都是分别针对其中的某一两类信息进行单独的分析推荐,有可能得不到最好的推荐效果。本文就是主要针对科学研究领域的文献推荐问题,力图能够提供一种统一的推荐模型,将各类信息有机的融合起来,来提升推荐效果。异构信息网络是一种能够描述多源、异构信息的方法,可以有效地将多种信息集成到一个模型之中,本文就是利用采集到的论文构建论文引用网络这个异构信息网络作为推荐模型,提取作者、研究领域和文本相似度等多种有效信息作为推荐依据,利用余弦相似度算法计算文献之间的相似度,进而用重启随机游走算法进行文献推荐,最后将推荐结果由高到低排序显示出来,从而实现文献推荐系统,达到为科研人员推荐学术论文、节省文献检索时间的目的。