针对稀疏性的协同过滤优化算法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:liuqingq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤是推荐系统中最流行且最成功的推荐算法。它基于群体智慧的思想,为目标用户选取行为最接近的邻居用户并根据邻居用户的喜好为目标用户进行推荐。协同过滤算法在帮助用户解决“信息过载”问题的同时还受到诸多问题的困扰。稀疏性问题是其面临的最主要问题,由于评分数据的过度稀疏导致相似度计算和邻居选择不准确,最终影响推荐结果的精度,同时推荐结果的可信度也大打折扣。本文针对协同过滤中的稀疏性问题,进行了较为深入地研究,提出了以下三种优化的协同过滤算法。(1)提出了基于预测值和用户/项目平均绝对误差(Mean Absolute Error,MAE)值填充的优化算法。计算每个用户/项目的MAE值,按照填充规则使用预测值与MAE值对评分矩阵中的空缺值进行填充,使用填充后的评分矩阵执行协同过滤算法。该算法确保填充值贴近各用户的评分均值,既保障了预测结果能够满足不同用户的个性化评分习惯,又提高了推荐的准确度。(2)提出了基于项目聚类的优化算法。对原始矩阵的项目列进行聚类,根据聚类结果构建两种更加稠密的“用户-类别”矩阵,据此计算出用户的两种相似度。将得到的相似度线性加权并结合修正系数作为最终的相似度进行推荐。该算法在更为稠密的矩阵上进行相似度计算,使推荐结果更为可信;同时由于矩阵规模减小,算法的效率也有所提升。(3)提出了基于信任网络的优化算法。将信任关系引入协同过滤中。使用用户间的共同评分以及传递规则构建信任网络。将信任网络的信任度与传统用户相似度进行线性加权,对用户未评分项目进行预测。该算法根据目标用户所信任用户的喜好进行商品推荐,其结果不仅比传统的基于邻居的推荐更加可信,同时推荐精度也获得了一定程度的提升。通过大量对比实验,证明了本文算法的有效性以及可行性。
其他文献
在当今互联网时代,信息的数量在不断呈现几何式的增长。用户已经不需要担心信息的匮乏,而转向担心如何有效获取信息。搜索引擎作为一支重要力量,极大的提高了用户在海量数据获取
大数据时代,海量知识让人目不暇接,大脑获取的大部分知识来自于视觉,而视觉是最容易获取信息的感官,提升阅读体验成为未来信息领域的核心追求。然而,推进剂配方概念设计过程
网络技术的快速发展带动了网络应用范围的扩大,随之出现了网络安全问题。目前网络攻击手段多达数千种,应对网络安全问题,除了防火墙,比较有效的措施是入侵检测系统。作为主动
随着我国社会经济的高速发展,环境污染问题尤其是空气污染问题越来越严重,引起了社会各界的广泛关注。空气质量预测是研究和治理空气污染问题的重要内容,目前世界上比较先进的空
大规模平行语料库是机器翻译、跨语言信息检索等自然语言处理应用的重要资源。互联网上存在着海量的多语言平行资源,以往的一些研究都致力于从一些多语网站中获取平行(即互为
传统秘密图像分存技术需要对图像的所有数据进行处理,由于图像数据量大,所以算法执行时间比较长,而且分存算法产生的数据总量与原始图像数据量相比扩张明显,会对网络传输和存
在计算机视觉研究领域中运动物体检测跟踪已成为了一个热点问题。视频监控中运动物体跟踪如何避免受到目标变化、场景复杂、发生变形等因素的干扰,实现目标识别、目标行为分析
在机会网络中移动终端设备能量受限的特点是影响机会网络应用大规模普及的重要因素之一。如何以能量有效利用的方式完成协作感知任务,达到较低的消息传输延迟和较好的消息投
环境污染问题一直是个大问题,困扰着人们的工作、生活和学习。污染物的监测也越来越受到人们的瞩目,污染源在线监测系统成为解决环境污染的有效途径之一。通常情况下,污染源在线
在现代信息社会里,表单是政府和各种企事业单位日常工作中常用的信息载体。传统电子表单普遍存在代码复用率低、开发效率低下、开发周期长、开发成本高等各种常见问题。随着