基于特征向量的个性化推荐算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:liuxc1112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子商务个性化推荐系统随着Web2.0技术的迅猛发展得到了广泛的关注和普及,为用户在日益增长的海量信息中发现自己所需要的信息提供了一种有效方法。电子商务网站使用电子商务推荐系统为用户提供个性化服务,模拟销售人员帮助用户进行购买。电子商务个性化推荐系统通过建立用户与信息之间的二元关系,利用相似性从海量信息库中挖掘目标用户可能感兴趣的对象,其本质是信息过滤,在理论和实践中都得到了很大发展,已有多种推荐算法提出并得到应用,包括基于人口统计学的推荐、基于内容的推荐、协同过滤推荐以及由不同的推荐方法组合而成的混合推荐,其中协同过滤是最成功和得到最广泛应用的推荐方法。随着电子商务规模的不断扩大,协同过滤方法遇到了一些挑战:数据稀疏性、可扩展性、冷开始问题等。本文对协同过滤推荐算法进行了深入的研究,提出了一种基于特征向量的协同过滤推荐算法,论文的主要研究工作及成果如下:①观察用户评分规律,研究已有评分一致性方法的优势和不足,提出了一种改进的评分一致性方法,能够有效解决用户打分尺度不一致的问题。②传统相似度度量方法直接在整个评分矩阵上度量对象之间的相似度,其精确度受到矩阵稀疏性的很大影响,也没有考虑产品特征,因而推荐质量不够理想,实时性也较差,本文提出的基于特征向量的推荐算法使用统计分析技术扫描评分矩阵和产品特征得到用户和产品的配置文件,配置文件保存特征向量,并在此基础上计算相似度,降低了计算复杂度,改善了数据的稀疏性,提高了推荐质量。③对传统推荐流程进行了分析,找出不足并对其进行改进。优化了部分步骤,减少了不必要的计算,进一步提高了推荐的实时性。算法分为初始化、离线更新、在线三个阶段执行,初始化阶段创建用户和产品的配置文件并计算相互之间的相似度;离线更新阶段使用不同的更新频率来更新用户与最近邻用户和全部其它用户的相似度;在线阶段使用改进的推荐算法,不必扫描所有的产品即可向用户产生推荐,在用户新产生对产品的评分时,增量更新配置文件。④实现了上述算法,利用Movielens数据集,首先分析和比较了Cosine、Pearson、Off-Cosine相似度计算方法的推荐准确度,然后针对本文提出的改进算法和传统算法进行了多个对比实验,实验表明:算法在推荐准确度和实时性上达到了较好效果。
其他文献
行人检测是基于图像/视频数据进行目标检测的一个重要分支,它在视频监控、智能交通、高级人机接口等多个领域具有广泛的应用前景。行人检测技术实现的一个主流思路就是从机器
张代远教授在其专著《神经网络新理论与方法》中提出的权函数神经网络模型简化了网络结构,克服了传统神经网络算法局部极小、收敛速度慢、难以求得全局最优点等缺陷。B-样条权
浮选过程中,泡沫具有明显的色彩特征,它与浮选生产工况密切相关,并能反映气泡所携带的矿物类型。现场操作工人往往通过观察浮选泡沫表面颜色进行生产调节,但肉眼难以观测到泡
随着网络规模的不断扩大,网络流量的不断增大,传统的入侵检测系统在高速网络环境下存在较大的性能瓶颈和缺陷。主要表现在两个方面:一是当前应用层的入侵检测系统虽然比较稳定
众所周知,比较是人类认识世界的一种重要手段和有说服力的表达方式,是世界各种语言的最重要的组成部分。随着Web2.0的深入发展,Internet技术更加注重与普通用户的交互,用户不
随着三维建模和三维扫描技术的飞速发展,三维网格数据的规模也同样快速增长,而这些数据的处理和存储问题开始凸显。现阶段有着很多对三维网格处理方面的研究,但是却基本没有
群智能算法是通过模拟自然界生物的群体行为而构造的随机优化算法,它为解决大量存在于计算机科学、管理科学、控制工程等领域的全局优化问题提供了新的途径,因此成为学术界长
设计模式是面向对象软件设计中针对典型问题的典型解决方案,被广泛应用于软件系统中。从代码中识别设计模式实例有助于对软件的理解和再工程。目前,设计模式结构特征的识别研究
视觉是人类获取信息的主要途径之一,而图像正是我们通过视觉获得信息的主要手段。在现阶段的工程项目和科学研究中,经常需要宽视角且高分辨率的图像。普通获取图像的设备无法直
随着社会经济的不断发展,人们的生活质量也越来越高,出门旅游变成了节假日人们的主流选择。在互联网技术飞速发展的今天,传统的旅游导览模式已经无法满足人们参观旅游的需求,