基于栈式自编码器的推荐算法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:wxtncxmmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代的浪潮已然来袭,个性化推荐作为解决信息过载问题的有效手段,已应用于社会生活各个领域,其市场前景日趋广阔。然而,挑战与机遇并存,特别是随着数据收集能力不断提升、范围不断拓展、规模不断增加,传统推荐算法在信息融合能力方面瓶颈凸显。近年来,深度学习在图像处理、自然语言处理与语音识别等领域取得的巨大成功,其卓越的数据处理能力得到广泛认可。鉴于此,基于深度学习的个性化推荐算法研究成为新的热点。已有研究表明,采用深度学习模型中的栈式自编码器,能够有效融合用户和产品侧信息,有利于缓解个性化推荐的冷启动和数据稀疏性问题。对此,本文围绕基于栈式自编码器的推荐算法开展研究,以进一步提高其Top-N推荐能力,并针对用户行为中的时效问题给出解决方案。首先,针对Top-N推荐问题,提出了基于栈式去噪自编码器的Top-N推荐模型。传统的推荐度量标准旨在减少预测的用户评分与实际评分之间的差距,Top-N推荐关注的是用户实际选择与推荐产品集合之间的契合度,更符合应用需求。本模型利用自编码器的解码功能来重构用户的评分向量,并根据重构后的评分向量对用户进行Top-N推荐。此外,模型融入了用户的侧信息以缓解冷启动和稀疏性问题,并验证了缺失值处理策略对推荐效果的影响。实验表明,本模型在召回率上要优于已有模型。其次,针对用户行为时效问题,首次提出了面向用户行为时效特性的松耦合推荐框架。时效问题是指用户的兴趣往往随着时间推移而变化或波动,一概而论的基于用户历史行为进行判断会损害推荐效果。传统的时效特性处理策略与推荐算法紧耦合,若直接应用于基于深度学习的推荐算法,会使模型的网络结构趋于复杂。对此,本框架首次从数据预处理的角度来处理时效问题,包含时效预处理、推荐单元及推荐综合三个模块。其中,时效预处理模块用于解析用户行为的时效特性,针对阶段性设计了基于异常检测的“面孔”隔离策略。推荐单元直接选用已有推荐算法,无需修改。实验表明,采用“面孔”隔离策略,该框架能够增强原有推荐算法的应用效果。
其他文献
体系能力发展方案规划是体系建设过程中的重要内容,具有指导性意义。现有的研究成果中缺乏定量分析方法以及数学模型为体系能力发展方案的规划提供有效的支持。本文围绕“体系能力发展方案规划”这一问题,从作战活动出发,结合能力差距大小对能力差距重要度进行评估,为能力方案规划提供重要依据。同时提出能力-费用关系模型,构建能力发展方案规划决策模型为能力方案选择以及资源分配提供定量化方法的支撑。论文的主要工作和创新
基于云计算的复杂系统仿真是利用云计算资源共享、计算能力强等优势为复杂系统仿真提供建模服务的新型仿真模式。仿真模型服务化研究是实现该仿真模式的重要支撑。当前仿真模型服务化技术对模型语义关联关系描述不足,且主要为模型提供本地调用接口,难以支持云架构下模型资源的共享,难以根据模型关联关系和用户QoS(服务质量)偏好选择满足需求的模型。因此,开展基于云计算的复杂系统仿真模型服务化技术研究对于有效描述仿真模
法定解除作为合同解除方式之一,不仅是法律赋予合同非违约方的一项重要权利,也是司法实践中发生纠纷较多的重要法律问题,在维系市场经济秩序、确保交易公平与安全方面起着重要的作用,《中华人民共和国民法典》(以下简称"民法典")合同编相较于《中华人民共和国合同法》(以下简称"合同法")完善了法定解除权的行使规则,但法律的每一次修订都并非尽善尽美,对于合同的法定解除,民法典在一些技术性规范方面未有明显突破,仍
高速磁浮列车是一种利用电磁力实现车辆沿轨道无接触“零高度”快速运行的新型交通工具,磁浮轨道在其中发挥着重要作用。它不仅与车辆悬浮导向系统相互作用产生电磁吸力实现车辆的稳定悬浮导向,而且它还是列车同步直线牵引系统的电机长定子部件,与车辆悬浮电磁铁相互作用产生直线牵引力,它的状态直接影响车辆的牵引和制动性能,特别是齿面环氧层擦伤、裂缝、脱落,线缆下挂及安装螺栓缺失等异常状况。而这些轨道状况处于这种长大
与传统语义学的研究对象不同,语义韵是一种语义环境。在这种环境中,单词和短语的意义受到其搭配词的影响。语义韵无法凭内省获得,只能通过对大量语料进行总结提炼,因此常给翻译实践带来难题。本研究首先在单语语料库中分别检索两组颜色词“红”和“RED”,“白”和“WHITE”,观察分析语料数据,探寻英汉颜色词语义韵差异。同时应用问卷调查方法和英汉平行语料库,分析语义韵差异给翻译带来的影响,并根据数据分析结果和
本报告选取军事协定《澳大利亚政府与菲律宾共和国政府关于访问部队的地位协定》(以下简称“本协定”)作为翻译素材。本协定围绕缔约方的权利与义务展开,内容全面,结构完整,属于典型的军事协定文本。本报告以文本类型理论为理论框架,探讨如何全面准确地传递军事协定的文本信息。军事协定属于信息型文本,要求译者以简洁流畅的文字,在目标文本中传递其全部信息。鉴于军事协定的重要性和法律翻译的传统,译者应采用直译策略,忠
本文针对载体视觉导引自主着陆问题的需求,开展基于合作目标视觉特征信息的相对运动参数估计相关算法研究,为视觉导引自主着陆的状态估计提供理论和技术支持。主要研究内容总结如下:(1)研究了合作目标检测识别与视觉特征提取算法。首先,根据合作目标的构形设计准则设计了由一个圆环和T型标志组成的易于识别且具备充裕视觉特征信息的新型合作目标用于辅助载体进行导航定位;其次,针对合作目标采集图像,研究了图像预处理、基
互联网发展带来信息爆炸式增长以及表达方式的多样化,使信息的传递变得更加高效、方便和快捷。层出不穷的数字化智能化信息技术也正不断改变着人们的生活。互联网新闻因时效性强、信息丰富等特点,成为用户最常检索的内容之一。面对海量新闻,人们同样遇到了一些无法避免的问题,即由于文本信息的过度膨胀导致用户难以找到所需要的内容,这也促使了文本可视化与关联检索等辅助多样化检索方式的技术逐步发展,如何在互联网环境下对各
兴趣点(Point of Interst,POI)是指人们发现有用或有趣的特定位置。POI提供了多样化的城市功能,在方便人们的日常生活方面发挥着重要作用。在城市中,感兴趣区域(Area of Interst,AOI)是基于位置服务(Location Based Service,LBS)术语中对POI的扩展概念,是指具有地理边界信息一片区域,传统上AOI多指大的商圈和城市功能区。本文主要关注细粒度A
在软件开发过程中,开发人员从某处复制粘贴一段源代码并对其进行修改是一种常见的编程方式,这种软件开发方法称之为代码复用。虽然代码复用技术确实给软件系统的研发带来许多便利,但由此导致软件系统中可能产生的大量克隆代码,不仅使整个源代码变得臃肿,增加软件系统的维护成本,而且会影响软件的质量,导致代码漏洞的引入和繁衍。正因如此,代码克隆检测一直是软件工程领域的一个基础研究课题。鉴于此,本文重点围绕基于序列联