基于深度自编码器网络的推荐算法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:xiaogui999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统能够有效的解决信息过载的问题。由于数据集的稀疏性问题,传统的推荐算法采用线性映射的方式往往限制了算法的表达能力。近年来,深度学习通过引入非线性变换成功推动了图像处理等领域研究的进展,与此同时,在推荐系统领域通过引入深度学习也取得了一定的研究成果。本文针对数据稀疏性导致的推荐算法的精准度不高的问题,提出了两种基于深度自编码器神经网络的个性化推荐模型:1)融合用户以及项目特征的双卷积自编码器神经网络的推荐模型。该模型结合卷积神经网络和深度自编码器网络,通过利用视频原始的评分矩阵,能够同时挖掘用户和项目深层隐含特征,有效的提取用户和项目间的关联性特征。提出的双卷积自编码器神经网络采用一维序列的方式分别挖掘用户和项目的评分序列,能够有效的避免传统自编码器网络中全连接的计算复杂度高以及无用连接带来的干扰性问题,并且能够深层挖掘用户与用户间以及项目与项目间的隐含相关性,有效预测用户对未知项目的评分。2)融合用户低阶和高阶特征的深度自编码器推荐模型。考虑到传统自编码器全连接思想的缺点以及结合推荐算法的固有特性,提出带有分簇策略的深度自编码器模型。该模型将不同用户簇作为独立域,采用协同自编码器网络提取域内用户的低阶隐含特征。同时将针对域内与域间用户采用深度因式分解机网络提取高阶两两交互隐含特征。最终根据建立的模型迭代训练预测出用户对未知项目的评分而进行推荐。最后,本文针对多个公开的数据集,采用均方根误差和平均绝对误差评价指标对本文模型性能进行验证,并将上述模型与多种经典和当前先进的推荐算法进行性能对比。大量实验结果表明,第一种模型不仅提高了推荐算法的精准度,还提高了推荐结果的稳定性和对真实数据集的普适性。模型在绝大多数的基准算法中具有精准度和对超参数不敏感的优势,只是相对于极少数经典算法的精准度有所欠缺。因此,为进一步提升推荐算法的精准度,本文又提出了第二种推荐算法模型并极大的提高了算法的精准度。对比两种算法可以发现,融合用户低阶和高阶特征的深度自编码器推荐模型的预测精准度要优于双卷积自编码器模型。然而,后者对于数据集的普适性和推荐结果的稳定性要优于前者。
其他文献
防范金融风险是国家审计保障经济社会稳定发展的重要抓手,如何协同多元主体治理更加复杂隐蔽的互联网金融风险值得研究。文章对照考察数字时代下的互联网金融风险防范瓶颈与国家审计能力建设,初步推测国家审计具备参与协同治理互联网金融风险的能力。基于金融脆弱性及其监管、国家审计免疫系统、协同治理等理论提出研究假设,并借用解释性案例印证国家审计主动参与协同治理互联网金融风险的合理性、必要性与可行性。国家审计能够综
期刊
报纸
在肺癌早期利用肺结节图像帮助医生完成肺结节的发现和诊断对于病患的病情控制有着非常重大的作用。在实际医学诊断过程中,肺部CT图像数量庞大,导致影像科医生的工作压力巨大,进而出现误诊漏诊问题。利用海量肺部CT数据的肺结节检索通过查找与待诊断结节图像相似的图像来完成辅助诊断给予医生诊断意见为上述问题提供了决策支持。本文基于卷积深度神经网络,针对不同的数据类型检索需求,提出了两种肺结节CT图像检索模型,并
学位
随着不同分辨率的显示设备数量的快速增长,图像和显示设备大小的不匹配问题使图像重定向方法成为计算机视觉领域的热点问题。内容感知图像重定向方法的主要目标是改变图像长宽比的同时保护图像中的主体对象,使变形尽可能发生在相对不重要的区域。但对于具有多个主体的图像重定向时会由于显著图的不准确造成主体对象的严重失真。同时,由于目前大多数算法并没有考虑图像重定向后的美学分布,生成的图像的美学结构容易受到破坏。针对
学位
行人再识别旨在从不同摄像头检索特定行人是否曾经出现,被广泛认为是一个图像检索的子问题。行人再识别技术面临着行人图像的分辨率变化大、拍摄角度不统一、光照条件差、环境变化大、行人姿态不断变化以及存在遮挡等严峻的挑战,是一个具有挑战性的课题。无监督的行人再识别技术不使用目标域图像的标注信息,其中的域泛化行人再识别能够在源数据集训练并直接在目标数据集进行测试,具有更广泛的实际应用意义。本文针对现有域泛化模
学位
<正>河南是中华文明的主要发祥地,物华天宝,人杰地灵,英才辈出。河南南阳的桐柏是淮河之源,也是革命老区,四大文化(盘古文化、淮源文化、佛道文化、苏区文化)与桐柏秀丽的自然风光相互融合,构成独具特色的桐柏文化。刘世忠,就出生在这块文化和英雄之地。凌寒独开暗香自来
期刊
学位
步入数字经济时代,越来越多的经济行为会以线上、虚拟的方式进行。在个人所得税征管中,涉税信息同样起到举足轻重的作用。一方面,涉税信息一直是税收征管能有效进行的基石,税收信息管理能力是税收征管能力的重要方面,在税收征管现代化的道路上,必然对税务机关的税收信息管理能力提出新的要求;另一方面,涉税信息主要以电子化、数据化的新形式呈现的,在此种新变化下,为保证税务机关能够获取足够的涉税信息,产生了税收信息管
学位
数据挖掘领域中的序列模式挖掘是一个研究热点课题,而且带有周期性间隙约束可以使得挖掘更具有针对性。其中,基于无重叠条件的序列模式挖掘问题与其他同类研究相比更具有研究意义。传统的序列模式挖掘只考虑模式在序列中的出现频率,忽略了外部效用对于模式的影响,这就导致一些出现频率低但是极为重要的模式被忽略而一些出现频率高但是影响程度不高的模式被发现。这不仅降低了挖掘效率,而且使用户的可用性降低。鉴于此,本文研究
学位
19世纪,欧洲引入自由贸易规则之时恰逢工业化大发展,竞争成为市场的主旋律,但完全自由竞争带来的弊端也逐渐显现:完全自由的竞争不仅损害了竞争的公平性,也损害了诚信经营者的利益。于是,所有市场经济国家开始研究如何规范市场竞争衍生出来的不公平情形,以保护经营者的利益,由此,反不正当竞争法孕育而生。虽然各国因历史背景和法律渊源不同而采取了不同的立法技术,但是当时所有的立法都关注诚信经营者的利益,防止他们受
学位