论文部分内容阅读
随着信息技术和互联网的发展,尤其是电子商务系统的崛起,人们的生活开始受到越来越多的电子信息冲击,爆炸式增长的信息资源开始给人们造成信息选择困扰。此时,推荐系统作为一种有效的信息过滤技术开始出现。推荐系统采用知识发现技术,解决人们进行生活中的信息、商品和服务等个性化推荐问题。由于协同过滤技术能够基于一些复杂的概念和难以进行机器自动分析内容的信息进行过滤,而且推荐比较新颖性,所以协同过滤推荐也是目前应用最广泛和最成功的个性化推荐技术之一。然而,传统的协同过滤技术面临着数据稀疏性、冷启动、扩展性、实时性和相似性度量等方面的挑战,影响了推荐系统的准确性。本文针对传统协同过滤推荐算法中存在的数据稀疏性和相似度量难等问题,提出了一种基于最优化邻居的协同过滤算法。在改进的推荐算法中,首先,该算法根据用户对项目的评分进行相似度计算,在邻居集合选取过程中采用动态选取策略。动态选取策略使得不同的用户能够根据其自身相似用户的相似度值确定邻居集的大小,而避免人为设定相似度阈值时应用场景的局限性和无法满足不同目标用户之间差异性等问题。该策略能有效提高邻居集中相似用户的质量,使得推荐精度得到很大的提升。然后,在目标用户相似邻居集上,通过构建用户信任模型的方法,计算邻居用户对目标用户的信任度值,根据相似用户对目标用户的信任度值,同样采取动态选取策略选取信任度值高的用户构建最优邻居集。信任度值是邻居用户对目标用户已评分项目进行预测评分的准确率,如果预测评分值与真实评分值差值小于给定阈值即为准确预测。从而有效避免邻居用户与目标用户共同评分项目过少,但相似度值较高的偶然性,能够充分选择对目标用户有推荐能力的用户参与预测评分。最后,在预测评分过程中,基于最优邻居集合,同时将信任度值代替相似度值进行预测评分。预测评分采用基于用户和基于项目相结合的方法,根据目标用户和目标项目的邻居集的信任度值大小,确定其在预测过程中所占比重。这样在有效提高推荐精度的同时缓解了矩阵稀疏性问题。如果目标用户邻居集过少或邻居集推荐能力过低,那么目标项目的邻居集在预测过程中比重增加,降低了由于目标用户评分稀疏对推荐精度的影响。实验表明,该算法能够显著地提高协同过滤推荐算法的推荐精度。