论文部分内容阅读
协同过滤作为电子商务发展至今应用最为广泛的个性化推荐算法之一,不仅为用户选择符合自身喜好的物品节省了许多时间与精力,还极大地提高了电商平台和卖家的经济利益。但是一方面现在个性化推荐系统仍旧存在很多问题亟待解决,例如数据的稀疏性、新用户或新商品的冷启动、推荐的准确性和多样性等问题。数据的稀疏性、新用户的冷启动、推荐的准确性和多样性等问题。另一方面,电子商务网站积累了大量用户行为的时间和空间的数据,但协同过滤等算法却并没有充分考虑到这些信息带来的影响,使得推荐结果的准确率无法得到更进一步的提升。本文考虑了物品用户位置分布的特征对物品相似性的影响,提出了改进的协同过滤算法。通过实验表明,该算法能够为用户产生精度更高的推荐列表的同时,推荐物品的多样性也有着优异的表现。我们的研究不但证明商品的用户分布特征也是协同过滤算法中应当考虑的度量商品相似性的一个重要因素,而且为电商平台如何有效地如何利用用户位置信息来提高推荐算法精度提供了有价值的思路。具体主要研究工作如下:(1)基于真实商品的用户分布进行分析,通过对比不同商品用户分布的差异性,总结和归纳其内在的规律并尝试性地探讨了这种差异性的可能产生的机理。在不同的地理位置环境下,用户有着不同的行为方式和偏好,这种偏好的差异会影响不同商品的用户分布规律,合理利用这一规律有助于理解用户偏好差异的产生机制并为高精度推荐算法的研究提供有效的思路。(2)为了研究商品位置分布的差异性对推荐算法精度的影响,本文提出距离分布系数这个指标来描述用户位置分布情况,并将这个指标作为表征物品的一个特殊属性。通过距离分布系数计算得出距离相似度之后,借助一个平衡因子融合评分信息计算得到混合相似度。在混合相似度的基础上,根据用户所处的位置利用K-Means算法将用户划分到不同的区域,然后在各区域利用协同过滤算法进行推荐,最后通过一个权值对所有获得的推荐列表进行加权,得到最终的推荐列表。通过在多个真实数据集上进行实验对比显示,本文所提出算法能有效的提高推荐的准确度和多样性。(3)通过对试验数据集的补充和完善,以及对用户位置信息的融合,我们设计了一个电影推荐系统,并将我们的算法应用到了该系统中。我们所设计的系统有几大特征,首先该系统能够利用新用户的地理位置产生推荐列表,从而缓解了新用户冷启动的问题;此外,系统所采用的推荐算法能够融合物品的空间分布特征和用户的位置信息,从而实现了更高精度的推荐。这些特征表明该电影推荐系统能够在有效提升用户体验的同时,也有较强的推广和应用价值。