基于深度学习和评论挖掘的动态混合推荐算法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:lele
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统基于用户历史行为数据建模用户兴趣偏好,从海量数据中获取有价值的信息。协同过滤算法因仅使用评分数据,简单高效,而被广泛应用,但是却存在评分数据稀疏和冷启动问题。引入深度学习技术到推荐系统中为解决上述问题带来了新的研究方向。深度学习可通过构建一种深层次非线性网络结构,从多源信息中提取用户和物品的非线性特征,具备强大的挖掘样本集潜在特征的能力。现如今,基于深度学习的推荐算法在一定程度上取得了不错的研究成果,但仍然存在一些问题:第一,很多基于深度学习算法中仅利用用户的评分数据建模,而忽略了很多不同类型的上下文信息,如评论、标签、地理、社交、时间等信息,未能很好的解决冷启动的问题。第二,在挖掘某用户或商品的评论集中,深度学习模型(RNN,CNN)虽然能很好的保留词序信息,但是将每个单词对评论特征提取的贡献视为同等重要,实际上如果能够加权每个单词的重要程度则能进一步提高推荐质量。第三,算法忽略了用户兴趣变化的时间特性。基于以上问题,本文提出了改进算法,具体工作如下:(1)针对传统协同过滤算法仅依靠用户评分数据的低维向量方法存在的推荐结果精确度低以及冷启动问题。本文提出一种新的动态混合推荐算法,将栈式降噪自动编码器融入到基于用户的协同过滤中,学习用户的深层次特征,并与基于用户项目属性偏好的相似度融合。在预测生成阶段,设置时间衰减项,动态预测访问概率,及时更新用户兴趣变化,从而提高推荐质量。在Movie Lens数据集上的实验结果表明,与UB-CF、AE、SDAE和SDAE-IA算法相比,该算法在准确率和召回率方面取得了较好的效果。(2)针对用户-兴趣点签到矩阵的高稀疏性问题和兴趣点评论文本重要度欠缺等问题。本文提出了Re Ge So模型。首先,利用预训练的BERT模型取代以往的词嵌入模型,直接将兴趣点评论信息送入到BERT模型得到每个评论信息的隐表达,采用双向LSTM并结合注意力机制来衡量每个单词对兴趣点评论文本挖掘的重要程度,使得模型可以较为准确的理解文本中的序列信息和情感趋向,并建模位置兴趣点的潜在因子。其次,在矩阵分解模型的基础上,融合位置兴趣点的用户社交信息和地理影响因子,将多源异构数据融入到统一的概率因子模型中求解,进而更加精准的挖掘用户兴趣偏好。实验结果表明,与没有使用双向LSTM注意力机制网络处理评论文本信息的算法相比,该算法推荐性能明显提高。本文共有图33个,表7个,参考文献88篇。
其他文献
2013年以来,我国经济进入新常态,强化逆周期调节成为经济工作的重点。随着宏观经济环境的不断变化,并购已成为企业寻求发展新动能、优化资源配置、进行战略调整的关键手段。近几年,煤电企业相继通过并购手段来进行逆周期布局,以期实现企业经济持续增长的目标。但现有研究发现,企业在逆周期进行并购重组对其经济增长的提升效果并不明显,具体表现为协同效应难以充分发挥,企业绩效普遍下降。因此,有必要对逆周期背景下企业
作为国际社会普遍认可的个人信息保护法的基本原则,目的限制原则基本含义包括目的明确和使用限制两方面的内容,目的明确要求信息控制者在进行个人信息收集之时,以特定、明确及合法的方式让信息主体知晓个人信息被收集和使用的目的,从而对个人信息的后续使用产生合理预期;使用限制则要求在个人信息的后续处理过程中,其处理方式不得逾越既定目的,除非符合其他法定行为规范,如出于公共利益、科学或历史研究或者统计目的之需要或
随着环保法规的日益严格,新的车用汽油标准对汽油中硫含量和烯烃含量以及苯含量提出了更高的要求,对高辛烷值清洁汽油调和组分的需求量逐年增加;另外随着芳烃下游产品需求量
伴随着互联网的普及,特别是新兴移动应用之间的泛在互连,各类数据呈现爆炸式增长,如何从中快速获取有用信息变得越来越难。在此背景下,推荐系统应运而生,在对抗信息过载问题方面扮演着重要角色。协同过滤(Collaborative Filtering)是构建推荐系统的关键技术之一,其核心思想是从“用户-物品”历史交互数据(如评分)中挖掘用户的潜在信息偏好,并据此为用户预测其未来可能感兴趣的物品。但是,相比于
在互联网迅猛发展的同时,人类所获得的信息资源的数量也在急剧增长。面对这个信息过载的互联网时代,为了帮助人类快速有效地筛选出有用的信息数据,推荐系统应运而生。推荐系统的核心是推荐算法。在众多的推荐算法中,协同过滤(Collaborative filtering,CF)算法是目前推荐系统经常使用的算法之一。CF算法首先通过搜集用户的过去行为数据来发现用户的个人喜好,然后根据用户喜好的不同对用户进行分组
玉米作为世界三大作物之一,也是我国主要的粮食作物和饲料作物,其种植面积和总产量仅次于水稻和小麦。近年来,玉米病害的发生越发严重,其中,玉米大斑病作为危害玉米生产的主
回转窑广泛应用于建材、冶金等行业,其中在水泥工业中应用最多。回转窑是水泥厂的核心设备,它主要由筒体、支承部件和传动部件组成。窑长期在高温、重载的恶劣环境下运转,经常发生筒体热弯曲变形和窑中心线偏移等故障。若不能及时发现这些窑的早期故障,将导致故障程度加深而发生窑停产事故,给企业带来巨大经济损失。目前,国内水泥厂缺乏对回转窑早期故障诊断的技术,还停留在故障严重时的事后检测阶段,不仅影响窑的正常生产,
金色蓝素蛋白(Auracyanin,Ac)是丝状不产氧光合细菌中发现的一类蓝铜蛋白,介导其循环电子传递链中替代复合物Ⅲ和反应中心之间的电子传递。本课题从光合玫瑰菌中提取并纯化出空
随着科技的发展,光束偏转装置被越来越广泛地使用到众多领域,如光束平滑、高速光开关、雷达扫描等。铌酸锂晶体具有较低的传输损耗(0.2d B/cm)和较高的光电系数(30.8pm/V),具有工艺完善、器件易于集成等优点,是优质的电光材料。现已研制并封装以带有锯齿电极的APE铌酸锂波导(或简称APE波导)为核心的电光光束偏转光芯片,并通过各项光学实验测试和改进该芯片的性能。针对实验过程中产生的大数据实时
本研究中国新疆塔克拉玛干沙漠分离纯化的5株沙漠藻进行培养,观察藻细胞显微结构进行形态学分类,再利用16S rDNA序列分析与16S-23S rDNA间隔ITS区序列系统发育分析进行分子生物学分类鉴定。再进一步对沙漠蓝藻mcy基因进行了分析,探讨沙漠蓝藻微囊藻毒素基因与淡水蓝藻微囊藻毒素基因之间的同源关系。本研究不仅为沙漠蓝藻的遗传多样性奠定基础,而且首次对沙漠蓝藻微囊藻毒素基因进行系统进化分析,并