面向多样性的推荐算法研究

来源 :电子科技大学 | 被引量 : 9次 | 上传用户:camino
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,人工智能技术日益展现出促进人类科技发展的巨大能量。推荐系统作为人工智能和机器学习领域中的一个重要分支,能够有效地帮助用户从海量数据中挖掘其潜在感兴趣的信息,因此获得了学术界的深入研究和产业界的广泛应用。然而,传统的推荐算法主要关注推荐结果的准确率,使得少量热门物品被推荐给大量的用户,用户的个性化体验很差。近十多年来,推荐系统设计者越来越重视推荐结果的多样性,给予系统上大量非热门物品更多的推荐机会。现有研究表明,简单地提高推荐结果的多样性很容易造成其准确率的下降。因此,如何在保证高准确率的同时提高推荐结果的多样性,仍是推荐算法研究中的一个重要课题。为了解决推荐系统的多样性-准确率难题,本文基于用户活跃度(用户与物品的历史交互频次)开展了一系列研究。真实数据集上的实证分析表明,用户活跃度越高,其喜好就越广泛,更易于接受多样性高的推荐结果;反之,其喜好越狭窄,更偏爱准确率高的推荐结果。基于不同活跃度的用户对推荐结果多样性需求的明显差异,本文完成了如下主要工作和贡献。(1)提出了对典型推荐算法的直接改进方法。本文将用户最近邻协同过滤算法原本的静态参数和用户活跃度相结合,实现自适应地对不同用户的相似度项进行不同幅度的降权;对物品最近邻协同过滤算法中每个目标用户的历史交互物品基于它们的流行度进行降权,目标用户的活跃度越大,降权越明显;在质量扩散算法的能量传播第一步和第三步,基于物品节点的流行度对传播概率增加扰动,使其更容易传播到冷门物品节点,并使用参数控制该扰动的影响力大小。真实数据集上的评测结果表明,对于高活跃度用户,三个改进算法的推荐结果多样性明显提高,并且对于低活跃度用户,其准确率基本没有发生下降。(2)提出了对推荐结果的重排序方法。本文提出两种重排序方法,第一种通过引入物品流行度,针对不同活跃度的用户,对其推荐结果中的新物品按照它们的流行度大小自适应地进行降权;第二种通过引入反向推荐思想,依据为物品推荐用户的思想对推荐结果中的新物品进行重新排序。真实数据集上的评测结果表明,相比于原始算法,两种重排序方法均能不同幅度地提高推荐结果的多样性,其中反向推荐重排序方法的多样性提高幅度更大,而物品流行度重排序方法在多样性提高的同时更均衡地兼顾到了准确率。(3)提出了新的多样性评价指标。本文提出了两种经过改进后的多样性评价指标,第一种在原海明距离评价指标的基础上,把每个用户的指标值与其用户活跃度相结合,从而得到改进后的海明距离指标。第二种通过将排序准确率指标和海明距离指标进行线性加权融合,从而得到综合了推荐结果多样性和准确率的复合指标。本文选择以往研究中公认的推荐多样性好的推荐算法,通过对比这些算法在新旧评价指标上的评测值,表明新的海明距离评价指标能够更严格地反映出推荐算法对于不同活跃度用户的多样性推荐能力,同时表明新的复合指标能够结合推荐结果多样性和准确率,更全面地反映出推荐算法的综合推荐能力。
其他文献
随着北京申办2008年奥运会的成功,国家越来越重视跳水运动的科学研究。本文针对跳水运动视频的跟踪问题进行研究,具体工作体现在以下几个方面: 改进了三参数的全局运动估计方
随着信息技术的发展和网络化经济的快速进步,制造业信息化、规模化和专业化越来越强,产品开发趋于分散化。在这一背景下,异地协同设计成为提高产品异地开发工作效率的一项重要技
动画自动生成技术(Automatic Generation of Computer Animation)是一个崭新的课题,它由中科院数学所的陆汝钤院士提出,是人工智能技术与电影艺术,图形学技术的结合,是以底层
近年来随着软件开发的日益复杂与软件成本的大幅度提高,测试工作所占的费用和时间比重也日益加剧,其中回归测试用例选择问题尤为突出。回归测试用例选择问题的核心就是如何在
互联网及各行各业信息化的快速发展,企业和单位需要处理的数据量越来越大。传统文件系统已经不能满足海量数据的存储需求,分布式文件系统成为解决海量数据存储的一种有效方式。
随着计算机及网络技术的飞速发展,数字作品传播和拷贝变得越来越方便,同时使得数字作品的信息安全保护和版权保护也成为迫切需要解决的实际问题。数字水印是近年来在信息安全
随着微处理器、无线通信技术和微机电系统的发展,产生了无线传感器网络这一新的信息获取和处理模式。多个传感器节点通过无线通信、自组织方式构成网络,协同工作实时感知、获
垃圾邮件不仅占据了邮件服务器的大量存储空间,还严重干扰了人们正常的信息交流。如何有效地控制垃圾邮件成为了一个重要的课题,越来越多的学者致力于邮件过滤技术的研究。支
混沌是非线性动力学系统所特有的一种运动形式,其应用于密码学中在近十几年来引起了学者们的极大关注,并已在密码学领域获得了广泛的应用,取得了一些较好的结果。 本论文首先