一种融合用户上下文信息和评分倾向度的协同过滤推荐系统

来源 :天津大学 | 被引量 : 0次 | 上传用户:leolover211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算、大数据等技术的不断进步,“互联网+”将进一步融入到人们的日常生活,深刻改变人们的生活方式,人们越来越依赖于互联网。在大数据时代,人们面临的信息过载问题日益严重,协同过滤推荐技术是解决信息过载问题的有力手段,而且还可以满足用户的个性化信息需求。协同过滤推荐技术通过对所有的用户历史行为数据进行分析,获得用户的潜在或未来的喜好,然后根据用户的喜好,从海量信息中过滤出与用户偏好相匹配的内容,从而主动为用户推荐满足用户需要或感兴趣的内容。基于内存的协同过滤无需要分析信息资源的内容,且可以发现用户潜在的兴趣,而且可解释性强、易实现,因此得到广泛的研究和应用。但在实际应用中,往往信息是无穷无尽的,但用户通常只会对少量项目进行关注或评分,最终导致数据稀疏性也更加严重,严重阻碍了协同过滤技术的发展和应用。本文在第三章首先提出一种基于用户上下文信息的相似性度量方法,该方法考虑了用户上下文信息对用户相似性的影响,能更准确的反映用户间的相关性,从而使最近邻用户的选取更加准确,提高评分预测的准确度,降低误差。其次提出了一种基于评分倾向度的相似性度量方法。该算法针对评分数据的稀疏性问题,引入评分倾向度的概念,综合考虑了用户评分,用户间共同关注的类别和喜好评价尺度的差异对用户相似性的影响,使用户的相似度计算更加符合实际,有效缓解了数据稀疏性带来的困扰。然后针对数据稀疏性导致评分预测不准确的问题,本文提出了一种动态评分预测方法,新的评分预测方法综合考虑了用户最近邻和项目最近邻在评分预测中的作用,实现了对缺失评分项的动态填充,使评分预测更精确。最后,结合本文提出的三种改进方法,本文提出了一种融合用户上下文信息和评分倾向度的协同过滤推荐算法CPCF。本文使用美国明尼苏达大学Grouplens研究组提供的MovieLens-1M数据集,采用5折交叉验证的方法,将数据集按照80%和20%的比例随机分为训练数据集和测试数据集;并使用平均绝对误差和推荐准确率两个指标来评价推荐算法的效果;共设计了四组实验,分别从基于用户上下文信息的相似度、基于用户评分倾向度的相似度、动态评分预测以及一种融合用户上下文信息和评分倾向度的协同过滤推荐系统的有效性四个方面来验证本文提出的改进算法的性能,通过实验证明本文所提算法可以有效缓解数据稀疏性问题,提高评分预测准确度和推荐准确率,改善推荐质量。
其他文献
随着网络技术和无线接入技术的迅速发展,尤其是近年来互联网多媒体应用的广泛出现,人们希望随时随地访问互联网,由此出现了以移动IPv6和代理移动IPv6为代表的移动性管理协议
颈总动脉中内中膜的厚度作为评估心脑血管疾病的最主要指标之一。在临床上,主要通过人工手动标记进行测量。为了解决医生工作量大,测量结果对个人依赖性高等问题,满足自动高
数字电视系统是一个庞大、复杂的系统工程。为了保证数字电视系统的正常运行,对于MPEG-2传输流的检测是非常关键和重要的。   本文介绍了MPEG-2传输流系统层的语法规范,介绍了
随着移动通信网络朝着全IP方向演进,网络层移动性技术层出不穷,主要分为基于客户端的移动性管理和基于网络的移动性管理两大类别。基于客户端的移动性管理以移动IPv6协议为代
无线通信业务的不断发展使得对通信信容量的需求不断增加,加剧了二者之间的矛盾。SIMO和SOMI系统作为MIMO系统两种特殊的组合方式,它继承了MIMO天线的许多特性,并且由于这两
随着3G技术推广,宽带多媒体业务不断涌现,移动数据传输速率变得越来越高,频谱资源日趋贫乏,高效地利用有限的通信资源是现代无线通信技术发展的关键。多输入多输出(MIMO)技术
高光谱图像是由高光谱遥感成像仪捕获的同时包含空间和光谱信息的图像,由于高光谱图像仪分辨率的限制以及自然界地物的复杂多样性,单像元点往往包含多种不同类别的地物,意味着“混合像元”广泛存在,这严重阻碍着高光谱图像处理向定量化方向的进一步发展。因此,如何有效地解决混合像元问题,实现高光谱图像解混具有重要意义。论文针对高光谱图像存在混合像元问题,采用基于统计理论的盲分离理论,研究非负独立成分分析算法,提出
波达方向(Direction of Arrival, DOA)估计作为阵列信号处理的一个重要研究方向,在雷达、通信等领域有着广泛的应用前景,目前,它已成为阵列天线系统和智能天线的关键技术。波
2006年,国际无线电干扰特别委员会将APD统计参量测量列为一种新的电磁骚扰的标准测量方法,写入CISPR16-1 Ed.2中。关于APD测量仪的指标要求以及APD测量方法等都有了明确的规
在向量网日臻完善的理论体系基础上,本论文重点研究了如何在局域网上搭建向量通信子网并提出了共享式局域网内虚拟融合交换机的新概念以及TCP/VN协议栈的新设计。在综合分析