基于物品推荐系统的协同过滤算法研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:xuelin_1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的飞速发展,让更多数据出现在人们身边,与日俱增的数据量为人们的生活提供了极大的便利,使人们在一定程度上摆脱了信息匾乏的困扰。但是在面对如此大的数据量时,要怎样精准地获取人们自己想要的信息却成了一个令人困惑的问题。现有的搜索工具在这样海量数据面前也显得无能为力,而推荐系统的出现为人们的个性化需求带来了福音,并且使得数据的获取更加高效和便捷。本文对几类常用推荐算法进行研究分析,虽然这些算法在不同领域中都有应用,但是仍然存在数据稀疏性、可拓展性等问题。针对这些问题,本文的研究基础是物品推荐系统中的传统协同过滤算法,本文研究了协同过滤算法、相似度计算和评分预测等相关技术,针对传统算法所存在的不足,主要工作如下:(1)考虑到传统协同过滤算法中所存在的数据稀疏、可扩展性差,另外考虑用户评分尺度的不同易导致相似用户寻找不准确等问题,本文引入了欧氏距离和降维等相关理论,提出基于用户相似性和评分预测融合协同过滤推荐算法。对评分矩阵进行改进,将评分均值差和权值的概念用于计算相似度,找寻最近邻,再引入目标用户及其相似用户的平均评分,最后进行推荐。本文用movielens公开数据集进行了多次实验,实验表明:新算法在推荐的准确率和覆盖率上都明显提升。(2)针对稀疏性问题,本文提出了基于物品(User-IIF)和用户(Item-IUF)的热门惩罚后的相似度计算方法,摒弃了传统将未评分的矩阵单元数与矩阵单元总数比值的稀疏度计算方法,考虑了关系密度对于稀疏度的影响,定义计算稀疏度的新方法,并对稀疏度进行加权处理,构建基于用户和物品的协同过滤算法。实验结果表明,新算法的推荐评估指标MAE值优于原算法,有良好的推荐效果。
其他文献
论述了图书馆2.0用户需求的多样性、层次性及关联性,充分借鉴相对成熟的Web2.0用户参与激励方法,在系统分析Web2.0与图书馆2.0特征的基础上,探讨了图书馆2.0服务模式下的用户
近日,来自全另各地的知名心脏外科专家会聚泉城对106医院实施心肺联合移植手术后33天的患者进行全面会诊.
以Thomson Reuters公司出品的"ISI论文合作及引用数据库"(2000~2009),运用文献计量学方法,从论文合作国家数量、论文合作数量、学科分布等方面,分析与评价我国的科研水平和发展趋
探讨全程监化(DOTS)管治初治涂阳肺结核患者的疗效.方法选择1992年12月~2000年6月由我站结核科门诊登记初治涂阳肺结核患者为治疗组;同时选择1985年1月~1992年11月门诊登记初治
介绍了医药类科技查新的重点及特点,然后按照查新报告的格式,分别从科学技术要点的填写、查新点的提取、检索策略的调整、检索结果的筛选、查新结论的撰写等方面,结合笔者多年的
近日,深圳市进行了首例非血缘无偿捐献的骨髓移植手术.医生把从深圳人潘庆伟身上采集到的造血干细胞
动静脉性下肢溃疡、褥疮、术后伤口愈合不良、糖尿病性溃疡及放射性溃疡等,由于局部组织坏死,血液循环紊乱,营养不良,抵抗力低下,再生能力差,且多合并混合性感染,而导致伤口