论文部分内容阅读
电子商务个性化推荐系统随着Web2.0技术的迅猛发展得到了广泛的关注和普及,为用户在日益增长的海量信息中发现自己所需要的信息提供了一种有效方法。电子商务网站使用电子商务推荐系统为用户提供个性化服务,模拟销售人员帮助用户进行购买。电子商务个性化推荐系统通过建立用户与信息之间的二元关系,利用相似性从海量信息库中挖掘目标用户可能感兴趣的对象,其本质是信息过滤,在理论和实践中都得到了很大发展,已有多种推荐算法提出并得到应用,包括基于人口统计学的推荐、基于内容的推荐、协同过滤推荐以及由不同的推荐方法组合而成的混合推荐,其中协同过滤是最成功和得到最广泛应用的推荐方法。随着电子商务规模的不断扩大,协同过滤方法遇到了一些挑战:数据稀疏性、可扩展性、冷开始问题等。本文对协同过滤推荐算法进行了深入的研究,提出了一种基于特征向量的协同过滤推荐算法,论文的主要研究工作及成果如下:①观察用户评分规律,研究已有评分一致性方法的优势和不足,提出了一种改进的评分一致性方法,能够有效解决用户打分尺度不一致的问题。②传统相似度度量方法直接在整个评分矩阵上度量对象之间的相似度,其精确度受到矩阵稀疏性的很大影响,也没有考虑产品特征,因而推荐质量不够理想,实时性也较差,本文提出的基于特征向量的推荐算法使用统计分析技术扫描评分矩阵和产品特征得到用户和产品的配置文件,配置文件保存特征向量,并在此基础上计算相似度,降低了计算复杂度,改善了数据的稀疏性,提高了推荐质量。③对传统推荐流程进行了分析,找出不足并对其进行改进。优化了部分步骤,减少了不必要的计算,进一步提高了推荐的实时性。算法分为初始化、离线更新、在线三个阶段执行,初始化阶段创建用户和产品的配置文件并计算相互之间的相似度;离线更新阶段使用不同的更新频率来更新用户与最近邻用户和全部其它用户的相似度;在线阶段使用改进的推荐算法,不必扫描所有的产品即可向用户产生推荐,在用户新产生对产品的评分时,增量更新配置文件。④实现了上述算法,利用Movielens数据集,首先分析和比较了Cosine、Pearson、Off-Cosine相似度计算方法的推荐准确度,然后针对本文提出的改进算法和传统算法进行了多个对比实验,实验表明:算法在推荐准确度和实时性上达到了较好效果。