融合评分矩阵与评论文本的混合推荐算法的研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:drgsdrgs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的高速发展使得用户正在面临信息爆炸的问题。推荐系统通过提供个性化的商品推荐服务来辅助用户进行决策,从而减轻消费者因选择过多而产生的焦虑和困惑。基于评分矩阵的推荐算法可以根据用户的评分模式对用户和商品进行建模,但该类算法面临严重的数据稀疏性问题。而用户生成的评论文本可以反应用户的喜好和商品特征等语义信息,利用这些信息可以有效缓解数据的稀疏性问题,从而提高模型推荐的准确率。本文主要基于深度学习技术,对融合评分矩阵与评论文本的混合推荐算法进行研究,取得的主要研究成果如下:(1)提出了基于BERT和注意力机制的双向门限递归单元的文本分析模型。首先,引入BERT作为词嵌入层来提取评论文本的语义信息。然后,针对卷积神经网络卷积核大小固定、不能有效处理文本序列的问题,提出了使用双向门限递归单元来编码评论文本,从两个方向捕获词的上下文信息,使模型能够更加准确地理解评论文本所表达出的含义。最后,通过引入注意力机制给每条评论赋予不同的权值,使模型能够聚焦于更加有用的评论。同时,采用深度矩阵分解模型来提取评分特征,解决了传统矩阵分解模型只能提取低阶、线性特征的问题,增强了特征向量间交互学习的能力。(2)提出了一种基于评分信息与评论文本特征的深度融合方法。由于基于评分矩阵与评论文本分别提取到的特征向量具有不同源性,所以他们被输出到不同的特征空间后不能进行联合学习。本文提出的深度融合方法通过串联因子分解机和多层感知机实现了多源特征间的交互学习,进一步提升了推荐的准确率。最后,在亚马逊的5个公开数据集上对所提出的模型进行了实验验证。实验结果表明,与多个较好的基于评论文本的深度推荐基准模型相比,本文所提出的模型预测误差最低,平均预测误差MSE和RMSE分别降低了大约3.99%和2.04%。
其他文献
脑卒中又称“中风”或“脑血管意外”。为一种急性脑血管疾病。据研究表明,脑卒中目前居于我国国民死亡原因的首位,同时,脑卒中也是导致我国成年人残基的第一病证。中医可以根据不同人的体质,采用辩证论治的方法,针对不同的体质特点,遣方用药,辨证施治。在此背景下,为了进一步探究治疗脑卒中的辨证治疗方法,对脑卒中用药规律进行研究,论文构建脑卒中用药规律分析模型,包括CC双聚类模型、随机森林以及适用度规则,逐步探
密码技术在维护信息的完整性、不可否认性、机密性及认证方面发挥着至关重要的作用,是保障信息安全的核心技术之一。我国强调密码技术的自主可控,商用密码技术必须加强自主创新。2017年,由我国国家密码管理局发布的《SM9标识密码算法》被国际标准化组织(ISO)采纳。随着国密SM9算法在国内外的认可不断提升,其在将来一定会在各个领域进行大规模应用。但从目前来看,国内外对于SM9标识密码算法的研究还处于起步阶
随着计算机计算能力和存储能力的不断进步,大数据已经成为人们耳熟能详的概念,人类社会也进入了大数据时代。然而,大数据时代也广泛存在着信息过载的问题。对于广大用户,面对数以亿计的数据,想从中寻找到自己真正需要的、有价值的信息往往举步维艰;对于广大创作者,让创作的优质信息精确高效地展现在目标受众面前,也是十分困难的。推荐系统就是这一现象的有效解决方案。推荐系统通过对用户和候选信息进行特征挖掘,给用户推荐
数据图表在展现数据特征方面存在独特的优势,数据可视化分析在人们对于海量数据的挖掘和运用过程中已成为必不可少的一环。但是,在数据爆发式增长的今天,数据集量级与复杂程度不断增加,传统可视化工具需要手动配置生成可视化视图,该方法难以满足用户在海量数据中挖掘有效信息的需求。为解决大数据时代数据可视化分析任务面临的高效性与准确性等难题,自动分析数据集可视化特征并进行价值评估的可视化推荐技术受到研究人员的高度
我国城市轨道交通的飞速发展,为人们的出行带来了很大的便利,但同时也给列车的运行安全带来挑战。随着列车速度不断提高,载重量不断增加,列车的检修也变得越来越重要。列车在长时间运行过程中,由于碰撞、老化等问题,列车底部中心鞘螺栓部位会出现表面裂纹、磨耗、松动、缺失等故障,容易引发重大交通事故,造成人员伤亡和财产损失,因此研究螺栓故障检测方法与技术,通过在线检测及时发现螺栓的故障,避免列车事故的发生,其研
随着数字技术和人类生产生活交汇融合,全球数据呈现爆发增长、海量集聚的特点,数据日益成为重要战略资源和新生产要素。党的十九届四中全会首次提出将数据作为生产要素参与分配。数据资源作为数据经济时代的重要生产要素,构建安全可信的数据要素市场,能够在充分释放数据红利,实现数据价值流转的同时,保障数据资源安全与数据主体的隐私保护需求,从而促进数字经济高效健康发展。联盟链作为区块链技术与实体经济的粘合剂,可以有
近年来,随着视频监控、短视频社交等领域的蓬勃发展,产生了海量的视频数据。视频目标分割算法的发展促进了视频内容理解技术的广泛应用,对于智能安防、视频存储和自动驾驶等任务具有重要意义。视频目标分割旨在将某些特定的、显著的目标从视频背景中分离出来,本质上是一种像素级分类任务。然而,由于视频内容的多样性和复杂性,使得视频中存在大量前景背景混淆、目标形态变化、目标尺度变化等诸多问题,给视频目标分割算法带来了
铁路建设是我国交通领域的重要范畴,随着铁路线路的大量开行及铁路运营里程的逐步增加,对铁路运行安全状态的监控显得越来越重要。目前,我国已经进行了铁路安全图像智能分析设备的铺设,这些系统主要采用人工图像判别方式,该判别方式任务量重、难以满足实时检测要求且容易产生漏报、误报现象。因此,开发基于人工智能的铁路图像监测及检测系统的需求也越来越迫切。本文基于国铁集团组织建设的动车组运行故障动态图像检测系统(T
当今,全球已步入万物互联和人工智能时代,随着智能识别技术的发展和普及,人们在获得便利的同时隐私安全正遭受着潜在的威胁。在视频监控和社交网络的大范围覆盖下,人脸数据成为最容易获取的生物特征隐私信息。因此,在大数据时代下,人脸数据的隐私问题值得人们深思,如何在隐匿人脸身份信息的同时保留人脸属性信息具有重要的研究价值和意义。本文学习了现有的人脸数据隐私保护方法,受监督学习和生成对抗网络的启发,提出了一种
随着我国铁路事业的快速发展,行车安全成为亟待解决的问题之一。其中,行人误闯是影响行车安全的重要因素。因此,及时检测是否有人员误闯列车运行线路可以保障行车安全。传统的行人检测方法难以实现高性能和实时性的检测任务。近年来,随着深度学习技术的快速发展,基于深度学习的目标检测算法取得了优异的成绩。因此,本文以优异的卷积神经网络为基础,结合嵌入式异构设备完成铁路场景下的行人检测,实现铁路安防的智能化。本文的