基于稀疏数据的协同过滤推荐算法研究及实现

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:zhaoyu_hit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤能够根据个人先前的行为数据信息,准确预测个人将来所需的数据。随着计算机科学技术的普及和应用,在互联网中产生了大规模的数据,给人们的选择带来了极大的困难。因此,研究协同过滤推荐具有理论意义和应用价值。本文在详细分析协同过滤推荐现存问题的基础上,针对稀疏数据问题进行研究,主要工作包括:第一,针对数据稀疏环境下相似性判断策略失效的问题,本文提出基于用户评分偏好的策略。首先,分析用户间评分值信任关系,在皮尔逊相关系数的基础上引入用户评分值信任度,在计算用户间相似性时使用评分值信任度加权;其次,通过挖掘用户评分值背后隐含的用户真实偏好信息,找出高分人群和低分人群,构建用户评分偏好模型;最后,综合改良相似性评判和评分估测方法,更加准确的评判用户间的相似性,以得到更加紧凑的用户类别和更加准确的估测结果。第二,针对稀疏数据问题和用户兴趣的模糊性问题,本文提出融合模糊聚类的策略。模糊C均值算法在进行欧氏距离计算时,仅仅考虑用户对电影的评分数据,这样显的过于片面。本文定义用户间的属性距离,把用户间的属性距离和评分值间的欧氏距离进行加权融合,计算用户间的综合距离;针对模糊C均值算法对孤立点很敏感,且很容易产生局部最优问题,本文结合k-means++算法和k-mediods算法各自的优点,先进行一次聚类中心的筛选,然后将最终结果的类中心定为初始类中心,用于改良模糊C均值算法,优化聚类结果;针对MovieLens中电影评分数据稀疏问题,本文使用电影的类型信息,把用户-电影评分矩阵转换成用户-电影类型偏爱矩阵,达到降低维度的效果,使数据相对不再稀疏。第三,为了将本文介绍的理论在可以运行的系统中用实际数据来验证,本文设计并实现了一个协同过滤推荐原型系统,该原型系统能够完成电影爬虫、电影推荐、热门电影播放及电影评分等功能。
其他文献
肿瘤的发生及其对治疗的耐受与细胞凋亡(Apoptosis,APO)的抑制有密切关系。细胞凋亡与坏死相比其所需刺激量小,细胞膜完整性好,所形成的凋亡小体迅速被周围细胞吞噬,对机体影响小,
随着互联网的迅猛发展,人们获取到的信息越来越来多,但这也带来了“信息过载”的问题。人们无法及时地获取到自己需要的信息,而推荐系统被认为是解决该问题的主要方法之一。推荐系统能够有效的帮助人们快速的获取他们想要的信息,但是在传统的推荐算法中存在着数据稀疏、冷启动等问题。而近年来,深度学习技术在图像处理以及自然语言处理等方面取得了令人瞩目的成就。本文将传统的推荐算法与深度学习算法相结合,以此来改善传统推
目的探讨心肺联合超声与脉搏指数连续心输出量(PICCO)监测在心力衰竭(HF)患者体液管理中的应用。方法采用前瞻性自身对照研究方法。选取2018年3~10月入住新疆维吾尔自治区人
全美幼儿教育协会根据准幼儿教师的不同学历、不同水平,制定出了全国统一的核心标准和三套层次化的培养标准,指明了幼儿教师的培养方向,提高了幼儿教师的入职起点,为幼儿教师
介绍了SMT工艺中最常见的一种BGA焊接不良的原因分析。以一款客诉PCB BGA焊接不良为例对其产生的原因进行分析和讲解,最终寻找到导致该款PCB BGA焊接不良的真正原因,并针对焊
<正>随着今年以来建设体育强国、发展体育产业的各项利好政策密集发布,我国体育产业将开启新一轮的爆发增长期。为顺应体育市场潮流发展,深挖年轻消费潜力,由中国纺织工业联
依托中国电影市场的蓬勃发展,个性化电影推荐系统需求也应运而生,构建更为精准的个性化电影推荐系统越来越重要。为了克服传统推荐算法的局限性,本文尝试使用神经网络技术,开
21世纪以来,全球经济向服务经济转型的趋势愈加明显,随着工业服务化逐渐模糊了生产和服务的界限,实施服务创新有助于产业调整,丰富产业价值链,实现产业优化升级。国家从战略新兴产业角度肯定了建筑业产品应属于“伴随有形实物的服务”,肯定了其服务属性。对于建筑业企业而言,怎样提高服务创新能力在产业变革中得以生存成为关键的现实问题。在如今信息时代下,改造提升传统产业,进行建筑业转型升级,要着力推动建筑业企业信
目的:建立酒龙胆质量标准,有效控制酒龙胆的质量,确保临床用药安全有效;通过比较龙胆酒制前后在大鼠体内组织分布情况,来探讨酒龙胆的性味归经,为进一步临床应用提供理论依据。方法:采用HPLC法测定酒龙胆中龙胆苦苷含量;建立一测多评法测定酒龙胆中3种环烯醚萜类成分含量;用紫外分光光度法测定酒龙胆总黄酮的含量测定;采用LC-MC法测定龙胆生品/酒龙胆水煎液中龙胆苦苷在大鼠体内的组织分布;CCK-8法测定酒
目的:分析快速康复在胃肠外科围手术期护理的方法及效果。方法:选取普宁市华侨医院体2016年6月至2017年6月收治的96例拟行手术治疗患者作为研究对象,将其随机分为干预组和对