基于二分图的混合推荐系统的研究与实现

来源 :北京邮电大学 | 被引量 : 13次 | 上传用户:gzlwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年随着互联网以及电子商务的飞速发展,互联网中的信息呈现出爆炸性的增长,用户无法从过量无用信息中挖掘出自己需要的物品或者信息,在这种情况下,个性化推荐系统应运而生。个性化推荐系统可以根据用户的喜好为用户推荐物品,帮助用户迅速找到自己的兴趣方向。但是随着个性化推荐系统的广泛应用,冷启动以及稀疏性等问题开始出现,基于单一算法的推荐系统已经不能满足实际需要。同时由于互联网信息的爆炸性增长,基于单机算法的推荐系统已经无法处理大规模数据。基于上述问题,论文对基于二分图的混合推荐系统进行了研究。首先对推荐系统的相关概念进行了介绍,并详细描述了基于隐语义模型的推荐算法SLIM (sparse linear method)以及基于二分图的推荐算法。本文对SLIM的核心思想进行了研究,分析了SLIM的缺点:无法学习未被同一用户评价过的物品之间的相似度;接着基于二分图对SLIM算法进行了改进,提出了一种新的混合推荐算法UIIM (user-item interest model),并通过实验验证了UIIM的推荐质量。其次,针对大规模数据带来的问题,设计实现了基于Spark的并行UIIM算法(Parallel_UIIM),并通过实验验证了Parallel_UIIM的准确性以及效率。经过实验证明,混合推荐算法UIIM的推荐质量要优于SLIM,对于评价量稀疏的用户,质量也同样有所提高;基于Spark实现的Parallel_UIIM算法在大数据规模上的效率要明显优于单机算法。最后,基于海量数据分析平台,设计了混合推荐系统的架构,并基于Mapreduce实现了三个数据预处理的算法,利用并行后的混合推荐算法Parallel_UIIM构建了混合推荐系统,为混合推荐算法的应用提供了案例。
其他文献
随着手机的广泛使用,尤其随着智能手机的普及,手机与个人电脑之间的界限越来越模糊,越来越多的人通过手机传递或者存放重要文件,隐私信息等。一旦手机遭到病毒攻击,对用户将造成重
在C2C电子商务中,信用评价至关重要,直接影响交易成功与否。目前的C2C电子商务信用评价系统,评分等级的设置相对简单,不能很好的反映真实的交易状况的问题。从而产生信用诋毁、信
随着经济的发展与人们生活方式的改变,中国已成为世界上移动终端用户最多的国家。能够支持移动接收的多媒体广播服务因庞大的移动终端使用人群而显得日渐必要。国际上现有一
当前,国内水环境污染十分严重,尤其是江河流域普遍遭到污染。水利部对全国700余条共约10万km长的河流开展的水资源质量评价结果表明:水质污染严重而不能用于灌溉(即劣于Ⅴ类)
学位
今天Web应用程序的界面不再是通过Web服务器中的模板生成,而是通过浏览器中的JavaScript生成。用Ajax技术构建Web应用程序,使Web应用程序的架构产生了一次重大变革。但通过Java
视频图像中的运动目标跟踪作为计算机视觉领域的核心研究课题之一,经过近50多年的发展得到了广泛而深入的研究。它融合了图像处理、模式识别、人工智能、自动控制等相关领域的
学位
动态心电图(DCG,Dynamic Electrocardiography)是临床上分析诊断心血管疾病的重要手段。如何从心电信号中有效地提取各种特征并进行分类识别处理,辅助医务人员进行各种心血管疾
随着计算机软硬件技术的飞速进步与发展,分布式虚拟现实系统受到各行各业越来越多的关注,在军事、医学、建筑、娱乐、教育等领域都显示出巨大的经济和社会效益。本文探讨了分布
龙芯系列处理器是中国科学院计算技术研究所自主研发的,兼容MIPS指令集的高性能通用处理器。目前已经广泛应用于各个领域,包括高性能计算、桌面和网络安全等。为了充分发挥龙芯
自然计算(Natural Computation)是表示由自然启发的计算的一般性术语,其研究内容一般包括人工神经网络,遗传算法,免疫算法,蚁群算法和粒子群算法等。由于多数的自然计算模型