基于Hadoop与Mahout的协同过滤图书推荐研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:xieshanxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于Hadoop开源分布式计算框架和Mahout协同过滤推荐引擎技术构建图书推荐引擎系统,并利用云模型和Pearson系数对传统协同过滤推荐算法进行改进,改善传统单机推荐算法在高维稀疏矩阵上进行运算所导致的系统性能不佳及推荐结果不准确的问题。利用实验对分布式推荐平台的整体性能及改善后的协同过滤推荐算法进行测试评估,发现当虚拟机节点不断增加时,协同过滤推荐引擎的计算时间不断减少,这表明推荐引擎系统的总体性能较传统单机推荐引擎得到提升;利用MAE分别对原始协同过滤推荐效果和改进后的推荐算法进行测评,发现改进后的推荐引擎算法的推荐准确率较改进前提高13.1%。
其他文献
(续第4期第29页)rn长沙县一直是全国产茶重点县.长沙县茶叶现代农业特色产业园主要在春华镇、路口镇、高桥镇、金井镇、开慧镇等7个镇的“百里茶廊产业带”,蜿蜒100多千米.产
期刊
信息质量提供了信息价值,信息价值对社会活动中的个人、组织甚至国家产生效用和影响。国内外学者很早就开始进行信息质量的研究工作,研究角度主要集中在对信息质量的定义及其评价指标的讨论。但是从法学角度对信息质量的研究较少。本文基于此对现行信息质量的法律制度进行梳理和比较,填补此研究角度的空白。美国的信息披露制度最为完备,信息质量的法律规范也较完善,对很多国家而言都具有借鉴意义,因此本文选取中美信息质量的法
本文以文献资料法、调查问卷法和实验法等研究方法,通过传统的身体素质训练法和“微团队”法对高职学生五项基本身体素质锻炼效果的实验和比较分析得出:1.通过“课课练”,学
大学生作为关系到国家未来发展的一个重点群体,他们的健康与否直接关系到我国社会、经济、文化的发展.因此,国家在不同的时期相继制订了大学生体质健康标准,提出“学校教育要
当前,高校面临女生整体体质逐年下降的现实困境,研究发现,影响高校女生体育参与度的因素有很多,从社会学、训练学、心理学等维度进行的深入分析,在女生自身层面,主要是受生理
以文献调研、网上资料调研的方法,收集国内外DDC应用的期刊论文、相关网页资料,总结近年来DDC在图书情报领域的应用现状与相关成果,涉及自动分类、知识组织体系互操作、taxon
近年来青少年肥胖率上升、视力水平下降等问题不断涌现,青少年整体素质水平呈下降趋势.做好青少年体育普及工作显得尤为的重要,本文从青少年体育现状和青少年体育普及的影响
良好的心理素质在赛场上能发挥较为积极的作用,使运动员能更好的调控自己,促进技术、战术水平的充分发挥,从而提高其实战能力.本文分析了古典式摔跤运动员应具备的几种心理素
随着计算机技术与网络技术的迅速发展与普及,信息的传播方式变得更加多样化,人们获取信息也变得更加便捷。在知识经济时代,用户的知识需求不断扩张,表现出多样化、个性化的特
美国职业体育联盟对美国的职业体育具有绝对的控制权和垄断权.从经济学的角度说,美国职业体育联盟是一个典型的垄断组织,被美国商业界称为“体育卡特尔”.