论文部分内容阅读
随着互联网在人类生活中逐步渗透,人们的生活方式也逐渐向智能化转变。智能化产品满足用户的个性化需求。而推荐系统则根据用户的个性化需求向用户提供商品信息。推荐系统主动给用户提供需求信息,帮助用户做更好的决策,解决用户为“买啥”而产生的困扰。目前,推荐系统已成功应用到社交网络、电子商务、搜索引擎、广告推荐等领域。推荐系统的好坏很大程度上取决于推荐技术。协同过滤推荐作为一种应用最热、研究最热的推荐技术,有其独有的优势,但是也存在一些问题,如数据稀疏性、冷启动、可扩展性等。本文则以推荐技术为出发点,以解决推荐系统准确率偏低和可扩展性差的问题为宗旨,透彻地研究了协同过滤推荐算法,并进一步提出了一种融合用户评分和项目属性的协同过滤推荐算法。针对推荐系统可扩展性差的问题和评分数据稀疏的问题,本文设计了用户特征模型和项目属性模型,并提出了一种更新用户评分矩阵的算法。为了缩减目标用户或目标项目邻居集的搜索空间,降低系统的计算量,本文利用k-means聚类算法分别对用户特征和项目属性进行聚类。在对项目属性聚类的基础上利用基于项目的协同过滤算法预测出用户对未评分项目的评分值,然后对评分矩阵中的缺省值进行填充,更新用户的评分矩阵。该算法有效地缓解了评分数据稀疏带来的影响。针对推荐系统准确率偏低的问题,本文在更新用户评分矩阵的基础上,提出了一种融合用户评分和项目属性的相似性计算方法。该方法综合考虑了用户评分差异的信息熵和评分项目属性的相似度。之后在对用户特征聚类的基础上利用该相似性计算方法查找目标用户的邻居集,提高了邻居用户查找的准确性。最后,在下列两种情况下进行实验:第一,将用户-项目评分的缺省值设置为0;第二,采用更新用户评分矩阵的算法进行填充缺省值。通过对比其它相似性计算方法,验证了本文相似性计算方法的有效性,并且在第二种情况下本文相似性计算方法的推荐质量更好。