基于自监督学习的去流行度偏差推荐算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:junyuan__zhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统作为缓解“信息过载”的有效途径,已具有大规模的应用。其中,基于共同群体偏好实现个性化推荐的协同过滤是应用最广泛的技术,但其输入数据的不平衡和损失函数的不公平,使其容易遭受流行度偏差问题。即相较于非流行的物品,推荐系统过于倾向推荐流行的物品,导致推荐系统中的马太效应。流行度偏差对推荐系统的各利益相关者都有不利影响,因此,如何缓解推荐系统中的流行度偏差是亟需解决的问题。之前大部分研究只从物品方考虑流行度偏差问题,即提高非流行物品的曝光率,而忽略了用户对非流行物品的偏好程度。由于用户对非流行物品的偏好程度并不一致,提高所有用户推荐中的非流行物品比例将影响用户体验。要结合用户非流行物品的偏好进行去流行度偏差的推荐存在以下难点:(1)用户对流行物品和非流行物品有个性化偏好,学习用户对非流行物品偏好时难免受到流行物品的影响;(2)非流行物品交互数据极其稀疏,难以学习完备的物品表征;(3)会话推荐场景中单个会话中交互数据稀少更限制了非流行物品的表征学习。为解决以上难点,本文提出基于双视图自监督学习的去流行度偏差推荐方法以及基于层次化自监督学习的去流行度偏差会话推荐方法。主要工作如下:设计了双视图用户偏好学习方法,对物品按流行度划分为流行与非流行两个视图,并在两种视图下分别计算用户偏好,从而避免了物品流行度在捕获用户真实兴趣时的干扰,学习到用户对非流行物品的个性化偏好,解决难点(1);设计了包含流行/非流行物品掩码、基于自注意力的隐式表征关键信息提取、双视图互信息最大化的辅助任务,更充分地学习物品的隐式表征,缓解非流行物品数据稀疏问题,解决难点(2)。综合双视图学习方法和自监督学习,提出基于双视图自监督学习的去流行度偏差推荐方法。迁移上述推荐模型中的物品表征到会话推荐模型,在用户级和会话级分别使用自监督学习,提出基于层次化的自监督学习的去流行度偏差会话推荐方法,有效缓解会话推荐场景中的流行度偏差问题,解决难点(3)。通过基于公开数据集的大量实验,证明了所提两种算法的有效性。根据所提模型设计并实现了一个去流行度偏差的电影推荐系统,包括电影流行度变化趋势展示、电影信息展示等功能,向用户推荐可能感兴趣的电影。
其他文献
5G通信商业化进程刺激网络边缘产生了大量异构的时延敏感型、计算密集型应用或业务,多接入边缘计算(Multi-Access Edge Computing,MEC)因其将计算资源下沉至用户侧并允许边缘用户将复杂的计算任务卸载至边缘服务器执行,以及拥有可靠的安全和隐私保护等特性得到了广泛的关注。同时,5G通信的关键技术之一的非正交多址接入(Non-orthogonal Multiple Access,N
学位
目的 :进行儿童康复专科护士培训并分析效果。方法 :于2021年7月—9月对78名儿童康复护士进行全脱产式专科护士培训:理论学习1个月,内容涵盖专科理论、专科技能、护理科研、护理管理与人文素养4个模块;临床实践1.5个月,以14项专科操作技术为重点。培训前后,比较学员护士胜任力得分情况,分析考核成绩,学员对授课教师的满意度及实践基地的评分。结果 :78名学员均顺利结业,培训后学员的护士胜任力得分高
期刊
随着社会经济的发展,轨道已成为城市交通系统的重要组成部分之一。与私家车、出租车、公交车等相比,轨道具有准时、高速、不拥堵的特点。识别轨道通勤者并挖掘他们的通勤出行模式,对于提高服务质量、促进公共交通的使用和优化运营调度具有重要作用。在现代城市TOD(Transit Oriented Development)发展模式下,轨道成为城市生长的重要骨架,研究轨道交通对城市职住关系的影响非常重要的。然而,现
学位
在深度学习领域中,卷积神经网络已经在图像分类、人脸识别、目标检测和语音识别等各种计算机视觉及自然语言处理任务中得到广泛应用。卷积神经网络的推理结果依赖于大量的网络参数及这些参数参与的复杂计算,这会限制它们在计算能力与存储空间有限的设备上的应用。因此,针对卷积神经网络的加速对人工智能的普及应用具有重要意义。静态网络在计算时计算图与网络参数都是固定的,这可能会限制它们的表示能力、效率以及可解释性。与静
学位
随着移动互联网的高速发展和移动设备的迅速普及,人们获得信息的渠道越来越多,其中以微博、Twitter、Facebook等为首的各大社交媒体平台逐渐成为了现代社会的消息集散地,社交媒体对于人类社会中信息的传播做出了巨大贡献,但其也正逐渐成为一把“双刃剑”,由于社交媒体的匿名性和平台缺乏有效的审核管理,平台中充斥着数量巨大的虚假新闻和各类谣言,这些虚假新闻在社交媒体的特性下迅速传播和发酵,无疑对社会造
学位
设备安全稳定运行关系到经济建设发展、人民生命财产安全和社会稳定,确保设备健康运转、有效预防事故发生已经引起越来越高的重视,数据驱动的人工智能和机器学习也正在为起重机械等典型工业设备的健康状态预测中提供技术支持。有关典型工业设备监测数据的预测任务在实际应用中面临极大的挑战性,首先是设备监测数据类型的多样性,其中包括温度、应变、振动、声音、转速、电信号等,不明显特征监测类别会影响状态预测的准确度。此外
学位
近年来,随着城市化进程的发展,国家经济快速发展,城市居民的生活水平不断提升。但随着城市规模扩大,城市人口逐年增加,也给城市建设带来了许多新的问题和挑战。比如,大量的城市人口流动给城市交通系统带来了极大的压力,造成了一系列交通问题和环境问题。与此同时,随着城市的夜生活越来越丰富多彩,城市居民的夜间出行需求日益增加,但是大多城市目前尚未规划夜间的公共交通系统。城市建设,交通先行。交通是城市发展的命脉,
学位
在传统医学诊断过程中,医生需要根据CT图像等数据对病人的身体情况做出准确判断,并及时制定对应的医疗方案。然而,相关CT标注数据的人工获取方法非常耗时费力,需要医生对大量切片图像手工勾画轮廓。人工标注数据重复性低,主观性强,分割结果因人而异。随着深度学习在多个学科领域的深入融合和发展,基于深度学习的医学CT图像处理技术展现出强大的优越性。本文基于大数据集下的腹部多器官图像分割任务,提出并实现了多种精
学位
随着图像大数据的兴起,图像中存在的语义信息也越加复杂。单标签分类已不能准确表述图像内容,因此多标签分类开始受到越来越多的关注,且成功应用于图像搜索系统、医疗诊断等领域。为进一步提高多标签模型性能,本文提出基于图注意力表示和基于自适应图模块的两种多标签图像分类方法,主要贡献如下:(1)针对现有的多标签方法只能粗略定位目标语义区域,且无法充分挖掘语义区域之间存在的标签相关性的问题,本文提出了基于图注意
学位
树木三维模型对虚拟城市,城市三维场景重建、构建数字孪生体有重要意义。通过提取树木点云骨架构建得到树木的三维模型是一种重要的重建方式。树木原始点云数据一般都存在点云数量庞大,密度不均匀,存在噪声点,以及点云数据部分缺失的问题。大多数传统算法在提取树木点云数据骨架时,会出现提取出来的骨架拓扑与原始树木拓扑不一致,以及骨架断裂或者骨架的居中性不佳的情况,从而不能够准确提取出树木骨架。如何解决这些问题,并
学位