基于协同过滤算法数据稀疏性问题的研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:kings0578
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,推荐算法在各个领域都已经取得不错的应用,其中协同过滤算法是应用比较广泛且成功的算法,但是协同过滤算法在解决“信息过载”问题时还受到一些问题的影响,数据稀疏性问题是其面临的主要问题。协同过滤算法是依靠用户-项目评分矩阵计算出相似度值找到最近邻居集,但是过于稀疏的评分数据会导致计算不出准确的相似度值,进而难以找到到真实的邻居集合,且得出的最近邻居集合在预测评分时又因只考虑共同评分项目而再次稀疏,最后影响推荐的精度。本文针对协同过滤算法数据稀疏性问题,进行了较为深入的分析与研究,提出以下三点缓解该问题提高推荐精度的办法。第一针对传统协同过滤算法的评分预测值受共同项目数量的影响,从降低最近邻居集中共同评分项目的稀疏程度入手,把与目标用户相似的但没有对目标项目评分的最近邻居用户也纳入评分预测中去,改进评分预测算法。第二从降低用户-项目评分矩阵稀疏程度的角度出发,提出基于预测值和多元值的混合填充算法。使用传统算法计算出用户-项目评分矩阵中未评分项目的预测值并保存,将预测值结合多元值按照填充规则对用户-项目评分矩阵混合填充,推荐时采用直接把填充值作为预测值和在填充后矩阵上进行协同过滤算法实验两种策略验证该填充规则能够比单一值填充取得更好的推荐效果。第三从优化相似度计算入手,提出基于用户兴趣偏好的混合协同过滤算法,挖掘用户评价过的项目属性,统计出用户对项目属性的偏好,建立用户-兴趣类型矩阵,再计算用户兴趣相似度,然后将用户评分相似度和用户兴趣相似度用一个动态参数融合形成综合相似度。最后在Movielens数据集上进行实验,实验结果表明,以上提出的方法都能够有效缓解数据稀疏问题,提高推荐精度。
其他文献
本文主要总结了目前医学高职实验课传统教学中存在的问题,对在实验课中引入翻转课堂的优势作了介绍,并分析了翻转课堂在实施中可能出现的问题,旨在为实验课的教学改革提供一
白龙江流域是我国滑坡泥石流灾害四大高发区之一,进行该区域滑坡敏感性评价,能够为决策者在灾害管理和设施建设规划方面提供帮助,对区域防灾减灾具有重要指导意义。本研究采
<正>兖州煤业股份有限公司在信息化建设过程中,坚持以财务信息化为重心,以整体规划和循序渐进为原则,通过不断整合物资采购、产品销售、人力资源及固定资产管理等信息资源,发
褐煤“二高三低”的特点决定了大型褐煤锅炉及其制粉系统具有一定的特殊性。对比分析了塔式炉与П形炉的技术特点和经济性,全面论述了风扇磨制粉系统及其3介质干燥剂的特点,
总结了稀土元素在钢中的存在形式、加入方法以及在钢中的作用机理,认为稀土添加在钢中可以起到改善夹杂物的形态、细化晶粒、微合金化以及净化等作用,介绍了稀土在钢中的应用
<正>"严以律己,就是要心存敬畏、手握戒尺,慎独慎微、勤于自省,遵守党纪国法,做到为政清廉。"习近平总书记这段话是对严以律己的深刻诠释。当下,我国经济发展进入新常态,改革
自1958年Kassander首次提出糖尿病胃轻瘫(DGP)概念以来,DGP患者的数量随着糖尿病发病率的上升而增多,大约50%以上糖尿病患者伴有DGP,严重降低了患者的生活质量,导致血糖波动,并且加速
正常情况下,狗狗在和主人交流的过程中,很可能会把主人的手或者其他部位含在嘴中,但不会咬下去,这是狗狗做游戏的方式。但有些狗狗可能会对主人"下狠嘴",甚至造成严重后果。
期刊
目的:在医院实施陪护管理后,探讨各利益相关群体对陪护工的满意度情况。方法:采用自行设计的问卷,对患者、家属、医护人员及陪护工自身进行满意度调查。结果:医院实施陪护管
<正>劳动力是不是资本?劳动力资本能不能转变为“劳动产权”?拥有这种产权的企业职工据此是否也能成为企业真正意义上的主人,并作为股东参与分红?对手这些可能涉及社会主义本
期刊