基于自编码器表征学习的top-N推荐算法

来源 :燕山大学 | 被引量 : 0次 | 上传用户:plghqr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在如今的信息化时代,每天都会产生大量的数据,这为用户寻找所需要的内容带来巨大的困难。为了帮助用户从大量数据中筛选出重要信息,个性化推荐系统便应运而生。其算法核心是分析用户历史行为,预测用户偏好,再从数据中挖掘符合用户偏好的内容并推荐给用户。然而由于算法原理的局限性,传统推荐算法不可避免的存在数据稀疏和冷启动问题。近年来深度学习的出现为推荐系统的研究指明了新的方向。但现有基于深度学习的推荐算法往往默认用户偏好一成不变,更没有针对用户评分序列的时序性进行建模,导致在特征提取过程中难以提取到特征之间的相关信息。另外现有方法没有考虑真实场景下存在的数据缺失、错误等问题,以至于模型推荐效果不佳,缺乏鲁棒性。针对以上问题,文本提出两种基于自编码器表征学习的top-N推荐算法。首先,针对现有推荐算法忽略用户偏好动态变化,以及没有根据时序数据建模导致输入特征内部相关性提取不足的问题,提出一种基于注意力自编码器和LSTM的top-N推荐算法。该算法首先基于自注意力机制设计编码模块,计算时间序列中内部特征的相关性,同时存储用户不同时期的偏好变化信息并形成特征编码。然后利用LSTM处理时序信息的有效性构造算法预测模块,分析特征编码中的隐含信息,进而预测用户对物品的打分并排序,制作top-N推荐榜单。然后,针对现实场景下数据存在用户操作不当造成的评分误差,以及信息缺失和错误等问题,提出一种基于栈式降噪自编码器和孪生神经网络的top-N推荐算法。为了模拟真实数据中存在噪声的问题,该推荐方法首先在原始输入数据中加入噪声,然后将带有噪声的数据输入第一层自编码器。之后再利用第二层自编码器学习特征编码。将学到的特征编码输入LSTM与孪生神经网络结合的预测模块预测用户评分并排序,确定top-N推荐列表。最后,在MovieLens 1M数据集和Movie Lens 100k数据集上进行实验,验证本文提出算法的有效性。
其他文献
随着科技的飞速发展,网络形式发生着巨大变化,如何快速准确地发现复杂网络中的重叠社区结构对于分析网络的功能起到至关重要的作用。现阶段,已有的重叠社区发现算法多从节点、边、子图等单角度发现重叠社区,不能综合全面地考虑多种信息进行社区发现;并且部分重叠社区发现算法虽然充分利用了网络中结构信息,但是具有较大的时间和空间开销。针对这些局限,本文展开了深入的研究。具体研究内容如下。首先,针对一些社区发现算法仅
学位
<正>2020年9月22日,中国石油和化学工业联合会国际交流与外企委员会(简称外资委)和罗兰贝格公司共同发布《全球石化跨国公司战略发展研究》。该报告是由外资委和罗兰贝格的研究团队用6个多月的时间完成的阶段性成果。全球战略石化跨国公司的全球业务将朝着成本最优化和技术制高点发展,通过纵向一体化和核心业务规模化的规模优势建立成本竞争力,向专用化学品市场延伸、关注技术创新和绿色驱动构建技术护城河,进一步加
期刊
手写签名认证作为生物特征认证之一,被广泛应用于金融场所和政府等多种场合。但是,离线式签名认证方式易受模仿攻击;在线接触式签名认证系统在新冠肺炎疫情仍在全球范围内肆虐的情况下可能威胁用户身体健康;而现有的在线非接触式签名认证工作感知距离范围较短,适用场景有限。本文聚焦于毫米波雷达信号在个体签名过程的传播特征建模及其在身份认证技术中的应用。主要研究工作可以概括为:首先,提出基于FMCW毫米波雷达的手写
学位
无人驾驶应用在开放式环境下面临耗费大量资金、分析大量复杂而不确定的人为因素和环境因素以及政府政策批准难等问题。而在封闭环境下却能有效避免这些问题,有利于实现无人驾驶技术应用落地。在半封闭环境下实现无人驾驶运输作业,合理的路径规划是提高无人驾驶作业效率的关键。但是在路径规划过程中发现,半封闭环境内存在多种不确定影响因素,直接或者间接地影响到无人驾驶中的路径规划模块,导致规划路线不合理。而且由于无人驾
学位
随着移动边缘计算(Mobile Edge Computing,MEC)技术逐步落地,MEC市场环境日新月异。顺应不同行业、不同类型的用户对MEC需求愈发多样化发展趋势,MEC需要动态调整其服务策略。为了提升用户服务体验,确保MEC系统高效、稳健运行,本文研究不同应用场景下的MEC服务策略。首先,针对延迟容忍、能耗敏感的MEC应用场景,考虑提高MEC系统的可靠性和节能水平,提出一种融合虚拟机修复与物
学位
<正>2023年的中央一号文件把“强化农业科技和装备支撑”摆在更为重要的位置,金融要充分发挥好桥梁作用,全力为农业科技创新、成果转化应用等提供保障农业现代化的关键在于科技进步与创新。党的二十大报告首次提出建设农业强国,2022年末的中央经济工作会议提出推动“科技—产业—金融”良性循环,2023年的中央一号文件把“强化农业科技和装备支撑”摆在更为重要的位置,深刻体现了我国坚定走好科技兴农道路的决心。
期刊
荧光粉与发光二极管搭配产生白光的照明器件具有健康舒适、组装技术简单以及能量利用率高等特点,广泛应用于家居照明、电子显示屏以及公共场所步行灯等方面。而这些产生白光的发光器件前提在于获得发光性质优异的荧光粉,因此荧光粉研究的焦点在于获得具有宽带激发和发射、高量子产率和单一相白光的荧光粉。本文围绕这些研究焦点,使用高温固相法为制备荧光粉手段,在化学性质稳定、结构刚度高以及合成条件温和的硼酸盐为基底上加入
学位
自然语言指令解析是使人和机器人之间的交互变得更自然、流畅的重要环节。在人-机器人交互过程中,使机器人了解指令的意图和指令中关键单词的含义是自然语言指令解析的基础工作,但往往自然语言指令数据难以收集,导致模型存在泛化能力差的问题。另外,自然语言指令导航是人-机器人交互所必须具备的能力,也是完成取物任务的前提,但由于自然语言的任意性,不同人对于相同任务的指令描述会存在不同,这可能会导致指令和导航行为动
学位
空腔是蛋白质分子的重要组成部分,它对蛋白质功能调控有极为重要的影响。蛋白质上存在多个空腔,其中活性位点所在空腔是发挥蛋白质调控功能的关键结构。然而,空腔随着蛋白质结构不停地运动变化,对领域专家观察理解造成了困难,因此借助可视化技术理解空腔成为生物信息领域的研究热点之一。通过对口袋(空腔的一种特殊情况)的别构运动进行干预,也能达到调控蛋白质功能的目的。但通过生物实验进行别构识别的方法耗时且昂贵,所以
学位
铜锌锡硫硒(Cu2ZnSn(S,Se)4,CZTSSe)是一种用于薄膜太阳能电池吸收层的理想材料,因为其所包含的元素丰富无毒,并具有高光吸收系数(10~4 cm-1)和连续可调的直接带隙(1.0~1.5 e V)。目前,低成本且环保的制备方法是CZTSSe太阳能电池能够实现大规模应用的关键。电化学分层沉积法因其无毒环保、操作简单、成本低廉和适合大面积制备等优点而极具发展前景。然而,由于金属之间的扩
学位