论文部分内容阅读
随着计算机和互联网技术的迅猛发展,网络中可获得的信息量呈指数增长。但这也导致信息过载问题,即信息的利用率反而降低。信息推荐技术,或推荐系统,被认为是解决信息过载最有效的工具之一。信息推荐技术是科学研究和工程应用中的热点问题。利用复杂网络理论和数据挖掘方法,本文主要致力于理解推荐系统中各要素特性和作用,探索提升准确性和多样性的信息推荐算法。主要工作如下:1.提出一种利用非近邻用户贡献的协同过滤推荐算法,该算法通过线性拟合的方式把近邻和非近邻用户的作用同时应用于推荐系统,结果显示,我们算法的准确性和多样性均优于传统的协同过滤算法。2.利用物质扩散过程在带权网络上的投影,我们分析了低分在推荐系统中的作用。结果表明,在稀疏的数据中,低分的作用有可能是正面的。更进一步地,活跃用户与流行商品的低分通常起着负面作用,非活跃用户与非流行商品的低分的作用反而是正面的。3.提出一种基于网络结构的推荐算法。该算法仅仅利用用户是否点击商品的信息来建立网络模型,并利用随机游走过程来计算用户之间的相似度,结果表明,我们算法在效率和准确率两个方面都要好于传统的协同过滤算法。4.提出一种解决推荐系统冷启动问题的算法,该算法通过逐个选择对推荐系统贡献最大的商品来进行评分,从而使得在用户评分较少的情况下,推荐算法也能做出比较准确的推荐结果。5.提出了一种新的算法专门用于冷门商品的推荐,该算法为每个商品找到可能对其感兴趣的用户,因此每个商品能够至少被推荐一次。结果表明,我们算法的准确性远远好于其他的一些算法。6.研究了现有几种常见推荐算法的多样性,结果表明,推荐算法的多样性除了跟算法自身的推荐机制有关以外,还与数据的稀疏程度有关。一般地,数据越稀疏,推荐算法的多样性越好。与此同时,我们还研究了推荐系统的多样性,结果表明,虽然系统的整体多样性逐渐下降,但用户的行为却是越来越多样化。