基于自动去噪算法和深度学习的混合推荐算法模型的研究与应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:nxbys
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,推荐系统被应用在越来越多的场景来缓解信息爆炸的时代用户信息过载的问题,一个好的推荐系统可以大量减少用户在寻找所需信息过程中花费的人力和时间,提高用户的体验感,为企业创造利润。因此,如何提高推荐系统性能,快速的在大量信息中筛选出用户的所需信息成为了时下一个炙手可热的研究课题。经过多年的发展,传统的简单推荐模型已经不能满足用户日渐丰富的信息,越来越多的研究尝试将深度学习用于推荐系统领域来实现推荐系统的智能化。本文针对推荐系统相关算法进行研究和应用,尝试将梯度提升决策树GBDT(Gradient Boosting Decision Tree)以及深度学习模型 WDL(Wide and Deep Learning)相结合,来实现一种可以实现自动化特征交叉的组合模型GWDL,并引入堆栈去噪自编码器SDAE(Stacked Denoised Autoencoder)技术。基于以上基础,本文研究并实现了混合推荐算法SDAE-GWDL,旨在提高原基础模型WDL各方面的性能,并将混合模型实际应用在电影推荐场景,来验证改进后模型的可用性。为了达到以上目标,本文主要研究工作如下:1.对WDL模型的特征工程部分进行研究,提出将GBDT决策树和WDL模型结合,从而解决深度学习模型WDL中需要手工特征交叉的问题,提高模型挖掘用户高阶特征的能力。2.对模型输出层部分进行研究,改进模型输入层的设计。3.对堆栈去噪自编码器进行研究,针对实际推荐场景中特征数据稀疏的问题,提出将SDAE与上述GWDL模型相结合,旨在提高模型推荐结果的准确度和去噪能力,并改善模型的冷启动性能。本文通过在三个推荐模型训练常用数据集(Movielens数据集、Lastfm数据集和Jester数据集)上进行模型的性能测试实验,采取Precision、AUC(Area Under the Curve)、Recall作为实验的评测指标,将三个数据集上上述评测指标的平均值对新模型的性能进行评测,实验结果表明,基础模型的Precision、AUC、Recall分别为0.7397、0.8401、0.5591,改进后模型的指标值分别为0.7626、0.8777、0.5934,三个指标均有不同程度的提升,验证了该算法模型在推荐方面的性能提升。此外,本文还评测指标mAP(mean average precision)对模型的冷启动性能进行了评测,结果表明改进模型的mAP在原模型的基础上平均提升了 2.45%。本文研究并提出的SDAE-GWDL算法模型可以提升推荐结果的准确度,改善推荐系统的冷启动性能。基于以上对推荐模型的研究,本文设计并实现了基于Django平台和改进后融合模型的个性化电影推荐系统。该系统实现了高效的个性化电影推荐功能,并且经实验验证融合模型的加入可以提高推荐结果的准确性以及改善推荐系统的冷启动性能。
其他文献
自从机器学习提出以来,计算机的应用范围越来越大,人工神经网络也引领着人工智能领域的研究,近几年,类脑计算的方法发展越来越迅速,特别是自从脉冲神经网络(Spiking Neural Networks,SNNs)的提出,类脑计算的发展到达了高潮。本文利用类脑计算的方式进行了关于图像识别的研究,具体内容如下:首先,介绍了类脑计算的研究背景和意义,综述国内外类脑计算的研究现状,阐述了本文的研究内容和技术路
鱼类年龄鉴定是鱼类生态学与渔业资源评估的基础和前提.不同鱼类的年龄鉴定方法目前还无统一标准,通常是几种方法相互补充与验证,但应用最广泛的仍是硬组织年轮法,即基于耳石、鳞片等钙化组织的生长纹结构鉴定年龄.近几年,利用眼晶状体鉴定鱼类年龄有了新的进展,特别是在软骨鱼类中有些新的应用.本文系统梳理了基于鱼体不同硬组织(包括钙化组织和晶状体)鉴定年龄的原理与应用,综述了鱼类硬组织年龄鉴定领域的最新进展,并就鱼类年龄鉴定的精度评价、潜在新方法、数据读取可视化等方面提出未来研究建议,以期为鱼类生长与年龄鉴定研究及应用
2019年8月我国新疆伊犁地区首次暴发牛结节性皮肤病(LSD),在不到一年内结节性皮肤病病毒从我国最西北部传到最东南部诸省区,之后LSD疫情迅速传播和扩散,2021年又波及我国多个省市区,呈大流行态势,对我国养牛业特别是奶牛业造成巨大危害和威胁.近年来,世界上特别是俄罗斯等国家又发现了LSD疫苗样疾病以及新的变异毒株,对LSD的防控提出了新挑战.为做好这一外来病的防控工作,通过LSD疫情流行现状与趋势、发现的新流行毒株与问题,探讨我国LSD防控的新策略,为有效控制、净化和根除该病提供指导.