基于知识图谱和注意力机制的推荐算法

来源 :中央财经大学 | 被引量 : 0次 | 上传用户:ken112233
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统中长期存在着冷启动和数据矩阵稀疏两大问题。已有研究证明,在推荐算法中引入知识图谱数据来作为用户或项目的辅助信息,可以有效缓解这两类问题。这一类算法被称为基于知识图谱的推荐算法(Knowledge Graph Based Recommendation system)。本文提出了一个基于知识图谱的多任务注意网络推荐框架MARK(Multi-task Attention network Recommendation based on Knowledge graph)。MARK模型由用户表示学习模块、项目表示学习模块和推荐模块三个部分组成,希望能够同时对用户表示和项目表示两个推荐预测中的核心向量进行学习。在用户表示学习模块中,模型采用实体传播算法提取了用户和知识图谱中实体的多层联系,并通过注意力机制从获得的多层知识图谱实体集中进一步筛选出价值较高的项目、过滤掉其它不重要的项目,有效提取了用户偏好表示。同时,考虑到推荐系统项目表示与知识图谱实体表示在低层特征上的相似性,在模型中引入了交叉压缩单元,通过高阶特征交互将两个模块联合起来,并以多任务学习的模式对推荐预测目标和知识图谱三元组的关系进行同步训练。最后,综合学习到的用户表示和项目表示后进行项目推荐。总的来说,MARK模型基于知识图谱中的实体传播获得用户的多层次拓展兴趣,并利用注意力机制来过滤实体传播中出现的噪声,从而构造合适的用户表示。为了最大限度地利用关系数据,MARK模型联合了知识图谱表示学习任务,通过一个多任务学习框架以端到端方式对推荐任务和推荐任务共同进行优化,是一个基于用户与项目交互和基于知识图谱的多任务学习通用框架。该模型基于知识图谱嵌入的同时无需再人为设计,就可以自动挖掘从用户有过历史交互行为的项目到候选候选项目的路径。模型不仅能够解决推荐系统中长期存在的冷启动和数据矩阵稀疏两大问题,也能更准确地推断用户的兴趣偏好,具有积极的实践意义。本文在真实世界的三个公开推荐数据集Movie Lens-20M、Last FM和Book-Crossing上对MARK算法进行了研究和验证。结果证明,MARK模型在点击率预测和top-K推荐这两个评估场景上都能获得相对于基准模型较好的效果。MARK模型的推荐提升主要是由模型框架中的用户表示学习模块和项目表示学习模块带来的,并且,无论是从用户角度,还是从项目角度,MARK模型都很好地学习其向量表示,甚至在不同类型的数据集上都能适应良好,获得不错的推荐结果。该模型理论上可行且具有很强的实用性。
其他文献
秦岭造山带经历了多期复杂的构造演化过程,其中早古生代时期是其演化过程的关键阶段,目前研究普遍认为早古生代由于商丹洋持续向北的俯冲,商丹断裂以北存在典型的“沟-弧-盆”体系。但是,对其东延地区—桐柏造山带早古生代时期的造山过程、构造格架和构造演化过程等问题仍然存在争议。目前的研究主要集中在秦岭造山带和桐柏造山带西段,而对介于桐柏与大别-苏鲁地区衔接位置的东段信阳地区的研究较为薄弱,对其在早古生代时期
学位
环境问题是目前各国普遍关注的重要问题,更是我国经济高质量发展中备受重视的焦点议题。企业不加约束的生产行为是引发环境问题的主要原因之一,如何促进企业绿色转型是目前亟待解决的问题之一。在此背景下绿色信贷应运而生,政府要求将企业披露的环境信息纳入金融信贷配给的考察因素,要求银行有意识地减少对节能环保尚未达标企业提供的信贷资金支持,进而从资金源头上遏制重污染企业的进一步扩张同时引导其向绿色生产企业转型。尽
学位
近年来,随着地球化学分析技术的快速发展,越来越多的非传统稳定同位素指标在地学的众多研究领域中展现出广阔的应用前景。其中镁同位素指标在地球表生地质过程研究中应用广泛,尤其在示踪大陆硅酸盐风化方面具有巨大潜力。本文通过对国际大洋发现计划(International Ocean Discovery Program;IODP)第363航次于澳大利亚西北岸外陆架上U1483站钻取的岩芯进行沉积物粒度、镁同位
学位
随着互联网发展进程的不断推进、互联网用户规模的不断扩大和科学技术的不断提升,互联网广告由于其传播范围广且不受时空的限制等自身具备的诸多优势在广告行业不断鼎新,互联网广告也被看作目前最稳定的商业模式,各大搜索引擎平台、社会化网络平台、短视频平台等企业的大部分收入来源都是广告,而广告也已经成为部分网络公司的核心变现模式。在互联网广告的投放系统中,广告按点击来收取费用是当前比较常用的费用结算方式,即广告
学位
中国黄土高原风尘物质来源,不仅蕴含着新生代以来全球变冷、青藏高原隆升以及亚洲内陆干旱化信息,而且与过去大气环流变化具有密切联系。第四纪以来,黄土-古土壤作为堆积在黄土高原之上最重要的沉积序列,具有完整性最好、厚度最大、连续性最好的特点,与极地冰芯和深海沉积物共同称为研究全球气候变化系统的三大支柱。由于黄土中普遍存在封闭温度高、化学性质稳定、抗干扰能力强的副矿物-锆石,并且得益于矿物微区原位分析技术
学位
经过30多年的发展,我国股票市场由最初的不完备的、单一板块的市场逐步发展成多层次的股票市场。目前中国股票市场主要由主板、创业板和科创板等组成,其中主板成立时间最早,服务于大型成熟企业;创业板成立于2013年,解决了中小型企业融资难的问题;而科创板则于2019年开设,服务于科技创新型企业,进一步为高研发成本科技企业降低了融资门槛。对于证券市场来说,股市波动是否具有稳定性是判断其成熟与否的一个标准;对
学位
随着时代的发展,互联网普及率近年来不断提高,在网络上进行购物的用户规模不断扩大。经过多项调查,研究者发现,在这网络快速发展的时代,口碑就是最好的广告,它会对人们的交易决策产生很大影响,因此,口碑也变得越来越受人重视。而近些年来,我国已进入基础物质消费过剩的时代,消费繁荣为居民带来了充足的闲置商品储备,这在供给端为二手经济发展积聚了较大能量,而经济增速放缓、消费者的消费理念日趋理性,这在需求层面也促
学位
南秦岭北带紧邻华北板块和扬子板块之间的商丹缝合带,该构造带出露的地层主体为泥盆系刘岭群,虽然前人对刘岭群从不同角度做了大量研究,但对于刘岭群沉积的构造背景、构造属性及两板块碰撞时限等问题仍存在分歧。论文选取了南秦岭北带柞水-山阳-丹凤地区的泥盆系刘岭群作为研究对象,运用沉积学、岩石学、地球化学和碎屑锆石年代学方法,对南秦岭北带泥盆系刘岭群的沉积演化特征、构造背景和物源进行研究,以期对前述问题的解决
学位
随着计算机性能的不断提升,飞速发展的人工智能和大数据技术早已融入人们生活的方方面面,深刻而迅速地改变着人类生活。将人工智能运用到司法实践中也是法治发展的必然趋势。人工智能与司法实践相结合,并不是为了取代专业司法从业人员的工作,而是作为一种辅助手段减少实践中的量刑失衡现象,增强司法公正性;减轻法官工作量,提升裁判速度,进而整体提高司法的权威性和效率。同时,法律判决预测研究可以为普通民众提供相对专业的
学位
高分辨率的全新世气候重建对探讨区域-全球古气候演化与人类社会发展具有重要意义。本文通过黄土高原南部渭南黄土生物标志物研究,揭示了该地区全新世以来的气候变化,并结合文化演化与历史记录,探讨了黄土高原南部全新世气候变化与人类社会的关系。运用甘油二烷基甘油四醚(GDGTs)指标定量重建的全新世温度在13.2-20.2℃间变化,其中,早全新世逐渐升温,至中全新世(距今约7000a)达到最温暖期,当时温度比
学位