基于Spark流式计算的实时电影推荐系统的研究与实现

来源 :武汉工程大学 | 被引量 : 0次 | 上传用户:tmdjapanese
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现今社会,随着科技的快速发展,电影方面的信息量与日俱增,与电影相关的信息超载情况已经成为了目前不容忽视的问题。当我们准备看部电影放松放松时,可能因为电影方面信息过多,想要寻找一部满意的电影放松一下将会变得十分困难。除此之外还有大量的用户隐式反馈没有被得到使用,因此如何从海量的电影信息中利用隐式反馈,寻找到自己想要看到电影变成了一个研究热点。此外对于新用户和新电影因为缺少相关数据,而无法产生推荐。针对以上问题,本文设计和实现基于Spark Streaming的实时电影推荐系统,为了能够将用户的隐式反馈和用户的显示反馈相结合,对用户进行实时的电影推荐。同时也解决新用户和新电影不能及时的得到推荐的问题。本文的主要研究工作有:1.在Spark平台上使用基于模型的协同过滤算法构建离线计算系统。设计了一个解决矩阵分解协同过滤算法的冷启动方法,相比于原始的协同过滤算法,提高了推荐精度。2.在Spark平台上使用Spark Steraming构建了在线计算系统。设计了模拟日志程序,它能够实时的产生用户日志文件;设计了Spark Streaming实时接收模块实时的接收和处理用户日志文件;提出如何量化用户隐式反馈计算关注度,将关注度与离线算法模型结合得到在线推荐列表。3.使用java设计电影推荐系统的WEB端。设计了用户操作浏览模块和管理员操作管理模块。用户操作浏览模块可以对用户提供注册、实时推荐等功能;管理员操作管理模块提供电影的添加和下架等功能。
其他文献
随着时代变化 ,价值来源的范围不断扩大。本文从企业角度 ,对劳动价值理论、资本价值理论、客户价值理论的基本思想和价值产生机理进行了阐述 ,指出三种价值理论是一个完整的
目前大功率LED灯具的散热问题已经成为制约LED行业深入发展的瓶颈,体积小、重量轻、结构相对简单、制造加工成本低的散热器是研究的主要方向。不同的散热器由于结构设计不同,
<正>与其他哺乳动物相比,人类更易患心血管疾病。美国研究人员日前在美国《国家科学院院刊》上报告,人类祖先的一个基因失活可能是导致人类容易患心血管疾病的"罪魁祸首"。此
本论文采用Gaussian98程序,密度泛函B3LYP/6-311G**方法,首次在理论上对以PCl3为磷源,在常压氢气氛下外延生长N型硅的整个过程的微观反应机理进行了理论研究。计算得到了各反
近日,人力资源社会保障部、教育部、公安部、财政部、中国人民银行等五部委联合发出通知,要求各地做好高校毕业生就业创业工作。积极拓宽就业领域&#183;支持多渠道就业&#183;
恩格斯的<路德维希&#183;费尔巴哈和德国古典哲学的终结>深刻地论证了哲学的基本问题,即思维与存在的关系问题,阐明了唯物主义立场.建设中国特色社会主义,是历史发展的必然性
长期以来,义敦岛弧带及甘孜―理塘结合带一直都是地质学界研究的热门地段,加之其特殊的大地构造位置和丰富的贵金属(谭洪旗等,2016)、有色金属等矿产资源而倍受广泛关注。
在中国现当代文学史上,运河文学却一直相对薄弱。最近,刘凤起一百五十万字的长篇小说《永远的大运河》,为运河文学添上重重一笔。小说对大运河畔恢弘壮阔的抗战场面的展示,对
近年来,含C、Si、O、N、S等原子的小分子化合物已经在无机化学,材料化学、有机化学、燃烧化学以及化学动力学等方面引起了广泛的重视。尤其是在大气化学和星际化学中,对这类
<正>《金瓶梅》中的西门庆是一个富商、官僚、恶霸三位一体的人物,靠着有钱送礼,巴结当道,倒腾了个官做;靠着财大气粗,在清河(临清)县呼风唤雨,欺男霸女。西门庆的权位、势力
会议