基于边缘降噪自动编码器的深度协同推荐方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:hfxwh6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤技术已经被广泛运用于推荐系统中。在应用协同过滤的传统推荐系统中,潜在因子扮演着最重要的角色,因而如何有效地学习潜在因子成为了首要任务。传统的协同过滤方法利用矩阵分解技术从用户的物品评分矩阵中学习到潜在特征向量,但该方法面临着冷启动问题和严重的稀疏性问题。由于深度学习在很多实际应用中都可以出色地完成特征提取的任务,于是许多研究人员通过深度学习的方法来提取稀疏文本信息的特征,进而优化协同过滤方法。但由于深度学习本身的训练要求,在结合深度学习技术的推荐方法中往往存在推荐质量和训练耗时不可兼顾的问题。为解决此问题,本文将边缘降噪自动编码器和概率矩阵分解模型结合,提出基于堆叠边缘降噪自动编码器的深度协同推荐方法,该方法能够很好地兼顾训练耗时和推荐质量。首先,本文把物品文本信息的词袋向量作为堆叠边缘地降噪自动编码器的输入,通过重构加噪的词袋向量并计算原始输入数据和重构数据的交叉熵误差来进行训练。在学习到编码和解码的映射矩阵之后,我们可以通过映射矩阵得到物品对应的隐藏层特征向量。之后,将隐藏层特征向量作为概率矩阵分解模型中物品潜在特征向量的基本值,并对用户物品评分矩阵使用矩阵分解技术,可以得到评分矩阵中蕴含的用户潜在特征向量和物品潜在特征向量。由两个不同的物品潜在特征向量组成新的物品潜在特征向量,然后,利用新的物品潜在特征向量对自动编码器进行反向微调。在完成两者的迭代训练之后,利用学习得到的用户潜在特征向量和物品潜在特征向量来进行预测工作。本文在Movielens和Netflix数据集下进行实验的对比以及结果分析。实验结果表明,本文提出的基于堆叠边缘降噪自动编码器的深度协同推荐方法能够有效地缩短训练所需的耗时,而且在模型的召回率和准确率上也都有一定的提高。
其他文献
<正>《隆中对》是历史,其根本价值是真实,历史的真实是理性的;《三国演义》是小说,其根本价值是审美,而审美价值是以情感为核心,是与理性对立统一的。《隆中对》写刘备主动去
目的 :观察较大剂量的复方板蓝根对急性咽炎的临床疗效。方法 :将 14 6例急性咽炎患者随机分为 3组 ,复方板蓝根组 4 8例 ,口服正常剂量 2~ 4倍的复方板蓝根 8~ 15片 /次 ,3次
在民族贫困地区城市化进程中,由于政府、学校在农民工子女家庭教育政策、措施上的缺失,出现了"留守儿童"在受教育过程中的种种问题。为解决好留守儿童的教育问题,政府和学校
在过去一个月里,全球钢材价格大幅下滑,钢材价格指数下滑15.3至269.3。这也是自2007年以来,钢铁价格指数首次出现下滑。从全球各地区来看,亚洲地区钢材价格下滑最快,其次为北
1月5日伦敦消息,西方新年假期结束以后,贸易恢复,欧洲现货锌锭溢价出现下滑趋势。对于溢价是否持续,业界有不同看法。伦敦消息说,1月5日那一周,鹿特丹特高级锌锭出库价格比同
期刊
巨齿兰州龙(新属、新种)是发现于中国甘肃省兰州盆地早白垩世地层中的一新鸟脚类恐龙,其牙齿是世界上已知植食性恐龙中最大的。兰州龙下颌长1m,每侧有14个齿槽,而单个牙齿宽
根据卫星对地观测原理,提出了一种基于任务规划的多星联合对地观测动态能力评估方法,并设计实现了相应的多星联合对地观测能力评估系统。该系统能够评估卫星系统针对具体任务
首先从伞降回收、垂直返回、带翼飞回和升力体式等类型分析了国外典型重复使用运载器的发展现状;然后从技术难度、对总体设计体系的影响、运载能力损失、对主发动机的技术要
目的:探讨银杏叶提取物(GBE)不同组分对高糖培养下系膜细胞增殖及细胞外基质(ECM)积聚的作用,阐明其作用机制。方法:高糖培养的系膜细胞分别给予GBE、总黄酮、总内酯、总黄酮水解物
习总书记强调,改革试点能否迈开步子、趟出路子,直接关系改革成效。据不完全统计,浙江各地承担的国家级改革试点有300多项,这既是对浙江相关工作的认可,也是对浙江进一步深化