【摘 要】
:
互联网技术的快速发展,催生了大数据时代的到来。网络资源的快速增长,导致网络用户难以从海量信息中提取到真正有效的信息资源。智能推荐技术的出现使人们获取资源变得更加容
论文部分内容阅读
互联网技术的快速发展,催生了大数据时代的到来。网络资源的快速增长,导致网络用户难以从海量信息中提取到真正有效的信息资源。智能推荐技术的出现使人们获取资源变得更加容易。在当前众多推荐技术中,应用广泛的是协同过滤推荐算法,但该算法自身也存在一些不足。本文针对协同过滤推荐算法的数据稀疏性问题、新用户冷启动问题和课程推荐算法框架整合与平台实现三个方面,展开以下三个方面的具体研究工作:1)针对数据稀疏性问题,本文首先采用用户对课程众数均值的评分来填充稀疏矩阵,然后分析比较基于项目众数均值和基于用户的两种推荐算法的平均绝对误差值、准确率和召回率,最后确定使用基于项目的推荐算法来进行课程信息推荐,从而有效降低了数据稀疏性。2)针对新用户冷启动问题,本文提出了一种基于TopN的冷启动推荐算法,该算法采用Hadoop TopN算法来计算出用户平均评分最高的N门课程,然后结合在MapReduce中编写的新用户推荐算法,来处理新用户的推荐问题。3)针对课程推荐算法框架整合与平台的实现,本文首先对课程推荐平台整体框架进行了设计,然后引入Hadoop集群对推荐算法的数据存储和计算进行了扩展,最后对课程推荐算法在平台中的应用进行了实现。实验结果分析证明,本文提出的方法能有效解决协同过滤推荐算法所面临的部分问题。基于项目众数均值的稀疏性算法在平均绝对误差值、准确率和召回率的评价标准上,均优于基于用户的推荐方法。在处理大数据集方面,经过基于Hadoop集群扩展的协同过滤推荐算法,在总体运行时间和加速比方面均优于单机系统。同时,本文也对存在的问题和下一步的改进计划进行了说明。
其他文献
语音识别是由声学模型解码与语言模型解码两部分共同作用下完成的,其中语言模型是语音识别一项重要的技术,也是语音识别当中的重要研究部分。传统的语言模型解码一般采用2-gr
Ⅲ族化合物半导体薄膜的研究在近几年来是一个研究热点,例如氧化镓(Ga2O3)、氧化铟(In2O3)、氮化镓(GaN)、氮化铟(InN)以及三元化合物铟镓氮(InxGa1-xN)。它们都是直接带隙n
X射线脉冲星导航是未来深空自主导航的一种方法,该方法采用脉冲星X射线脉冲作为导航信号源,具有独立性好、使用权不受限制、能够提供精准的时间参考等优点,因此美国、欧洲以
随着信息技术的高速发展,各领域数据的量级呈现爆炸式增长,伴随而来的数据质量问题,如数据失真、数据过期、数据缺失、数据表达不一致等问题,也日益凸显。本文主要研究数据质
随着计算机技术的发展,高校里的设备需要正常的运行,现在高校设备的管理比较混乱,资源分配不平衡,设备闲置非常严重,使用设备管理系统来对设备进行管理可以提高设备的管理水
流程模型差别检测技术作为流程模型管理技术的重要组成部分,已经在流程模型管理过程中得到了广泛的应用。但是,现有的差别检测算法的相关研究存在以下几个方面的问题:1、现有
雾霾天气条件下,由于大气粒子的散射作用导致图像对比度降低、视觉效果较差,一些重要信息被雾气所掩盖而无法识别。因此,去雾技术已经成为图像处理以及计算机视觉领域内研究
智能视频监控作用越来越突出,其核心技术是事件检测。本文主要研究了与智能视频监控相关的行人检测、事件检测和多GPU并行优化三个方面。行人检测方面,本文提出了一种高效的
无线传感器网络(Wireless Sensor Network,WSN)是当前国际上备受关注的一种从属于信息技术领域的新学科,它综合了无线通信技术、微电子技术、传感器技术、嵌入式计算技术、信
随着Android设备流行程度的快速增长,Android应用为人们的生活和学习提供了丰富的功能。目前流行的Android应用程序的下载量已有过亿,因此一旦下载的应用程序出现安全问题,将