【摘 要】
:
随着互联网技术的不断进步,整个社会的数据量越来越大,在大数据的环境下,用户对获取自己想要的信息的方式也提出了更高的要求,目前用户获取自己想要的信息的主要方式是采用搜
论文部分内容阅读
随着互联网技术的不断进步,整个社会的数据量越来越大,在大数据的环境下,用户对获取自己想要的信息的方式也提出了更高的要求,目前用户获取自己想要的信息的主要方式是采用搜索引擎,搜索引擎确实可以帮助用户去查询用户想要的信息,但是如果说能有一个系统可以自动的给用户提供其想要的信息,那么则可以很大程度上方便用户,推荐引擎就具有这样的功能。本文通过构建一个基于用户画像的推荐引擎来对用户进行推荐,基于用户画像给用户推荐的商品是符合用户的爱好的,但是为了推荐结果不至于单一,还要考虑新颖性的问题,因此本文还加入了协同过滤算法,其需要计算用户或者物品的相似度作为推荐的依据,通过交叉计算可以推荐出对于用户来讲比较新颖的商品。本文在实践的过程中,经过调研了解到生产环境的推荐系统都是由实时和离线两部分组成,实时部分采用Spark Streaming和Kafka结合的技术,Kafka从应用上实时获取到用户操作的信息,然后交给Spark Streaming做过滤,最后交给推荐引擎获取推荐结果。离线部分采用Mahout技术,Mahout内置了协同过滤算法,可以离线计算用户和用户的相似度及用户和物品的相似度,这些计算耗时很大,不适合在线计算,因此采用离线。用户画像数据也需要离线计算并周期性更新,保证推荐结果能够根据用户兴趣的改变而改变。整个案例在实施过程中,数据存储采用了Mysql、Redis和Hbase等存储介质。
其他文献
目的:探讨影响产后出血的原因及其相关危险因素。方法:回顾性分析2005年1月~2006年12月65例产后出血产妇的心理状态、分娩方式和产程情况。结果:产后出血与分娩方式、产程、胎
玉米在我国南北方大部分区域内都有种植,想要保证并提高玉米的种植产量,需要对种植的过程中加强管理力度,有针对性的进行病虫害的有效防治,玉米质量以及产量都得到了保障,进而农户的经济收入也能够进一步提高。 一、种植管理 1、苗期管理 在玉米苗生长阶段,需采取有效的种植技术,加强田间的种植管理,这样才能有利于玉米根系的正常生长,幼苗的抗病虫害的能力才能增强,同时为玉米高产量打下了良好的基础。苗期主要
营改增是我国税收制度改革过程中的一个"里程碑",从2006年5月1日开始全面实施,其中建筑业受到的影响最大,建筑业的税负从原来的3%的营业税改变为征收11%的增值税,本文对营改
孟加拉国的乡村银行□王家琚孟加拉国的“乡村银行”及其方法(GB模式),被誉为世界上规模最大、效益最好的扶贫项目之一,在国际上受到广泛的推崇。GB模式已在47个国家和地区开始规模不等
随着我国农业的发展,各种农作物在生产种植方面已经取得了重大进步.随着人们生活水平的提高,人们对于食物营养均衡方面有了较大的重视.我国人民现在对于主食已经不再仅仅停留
[目的/意义]旨在提高图书馆个性化推荐服务质量。[方法/过程]分析了动态精准画像应用于图书馆的可行性,介绍了图书馆用户画像的构建流程,构建了基于动态精准画像的图书馆个性
分析工作流引擎调度中过程实例和活动实例的状态信息,以关系数据库和.NET来实现工作流的执行引擎,介绍完整的过程E—R关系模型及其相关数据模型,阐述流程调度算法,给出应用实例。
<正>教育的过程是生命成长、生命互动的的过程,因此,我们提出"全员育人,共同成长"。基于此办学理念,我们以学生的成长为核心,着力打造师生和谐、生生共进、家校共育的生命成
以单粒子理论假设为基础,详细阐述了外加纵向磁场在等离子体中的不均匀分布形态,以及这种不均匀磁场对TIG焊接电弧形状的影响,分析了电弧区的受力情况,建立了等离子体中带电