论文部分内容阅读
近几年,随着电子商务的飞速发展与互联网的普及,人们的生活越来越方便,可以在足不出户的情况下选择自己想要的商品,电子商务系统也不断地为消费者供给商品与服务。但是,随着用户的不断增加,电子商务系统提供商品的种类信息等也不断地增加,虽然用户可以方便的选择各种各样的商品,但如今用户很难在众多的信息中准确迅速地找到自己感兴趣的商品,此时,电子商务推荐系统的改进与优化迫在眉睫。如今已存在很多推荐算法,主要可以分为以用户主观为标准的个性化推荐,以及与用户主观意向无关的非个性化推荐算法,相应地推荐系统也可以被分为非个性化推荐和个性化推荐系统。推荐系统所提供的个性化推荐是根据用户的历史行为给予推荐,而非个性化推荐则不考虑用户历史数据。本文主要研究的是个性化推荐算法中的协同过滤,由于传统的协同过滤具有一些缺点,本文针对其缺点进行一些相应改进,主要工作如下:首先,采用最传统且使用最为广泛的推荐算法,即协同过滤推荐算法。协同过滤推荐算法可分为基于用户的协同过滤推荐算法和基于项目的协同过滤推荐算法两种。第一种是通过计算用户之间的相似性进行推荐的,而另一种是通过计算项目之间的相似性进行推荐的,本文主要采用的是基于用户的协同过滤。其次,采用混合协同过滤推荐算法。针对基于用户的协同过滤推荐算法的稀疏性进行优化。在现实生活中,用户对项目的评分只是其中的小部分,使得评分数据非常稀疏,这将导致用户相似度的计算存在着很大的误差,很难准确的找到用户的“邻居”,直接影响着推荐结果的准确性。本文根据项目的相似性进行评分预测,解决评分矩阵的稀疏性,再根据近邻用户的行为实施推荐。最后,由于电子商务的飞速发展,用户与项目都不断增加,导致在使用协同过滤推荐算法时计算相似性的效率低、推荐不及时等问题的出现。为更好的解决此问题,本文提出结合数据挖掘算法。首先使用k-means用户聚类,根据用户的行为习惯把用户分成不同的簇,然后使用项目相似性解决评分矩阵的稀疏性,最后在此基础上使用协同过滤推荐算法,先判断用户具体属于哪个簇,在簇内计算用户相似性。这样,将最大限度的减少计算量,提高推荐算法的效率,并且经过最终实验结果验证,此优化方式将提高算法的准确性。