基于用户行为的流式推荐方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:s5df45sd6546f
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统已经广泛地融入到了人们的日常生活,并在改善用户体验、提高企业效益方面发挥着重要的作用。但是,推荐系统普遍采用离线推荐方法,周期性地利用大量用户与物品的历史交互数据训练推荐模型,不能及时地捕获隐含在近期交互数据中的用户最新偏好,难以在流式场景中为用户精确地推荐物品。针对这一问题,研究者们提出了流式推荐方法,利用新接收到的交互数据即时地训练推荐模型,有效地捕获用户的最新偏好,从而在流式场景中提高推荐的精确度。然而,流式推荐面临着诸多挑战,包括如何同时捕获用户的近期偏好和长期偏好,如何应对欠载场景和过载场景,如何解决用户偏好和物品特征的异质性问题以及如何利用如购买、加购物车和浏览等多种行为类型的交互数据提高推荐精确度等。另外,流式场景中负载强度容易发生波动,流式推荐方法所需计算资源不断变化,需要具有较短响应时间的资源调度方法快速地调度计算资源。出于可扩展性的考虑,推荐系统通常部署在云环境中。然而,研究者们对云环境下面向响应时间优化的资源调度方法研究较少。为了应对以上挑战,本文从数据采样、推荐模型创新和资源调度等多方面开展了研究。主要包含以下四个方面:(1)基于时间分层采样的自适应集成学习方法。为同时捕获用户近期偏好和长期偏好,研究时间分层采样方法。该方法从新接收到的数据和历史数据中分别采样得到训练数据,以便从新数据中捕获用户的近期偏好、从历史数据中捕获用户的长期偏好。针对过载问题,研究自适应集成学习方法。该方法首先利用训练数据并行地训练多个独立的子推荐模型,以便高效地处理过量的数据,然后通过序列自适应融合方法融合这些子模型的结果,从而实现精确的流式推荐。利用真实世界中用户与物品的交互数据模拟数据流,对提出的推荐方法进行实验验证与结果分析,通过比较推荐精确度,验证了提出的方法在过载场景中的有效性。(2)基于历史数据增强采样的双翼混合专家推荐方法。针对欠载场景中新数据不足的问题,研究历史数据增强采样方法。该方法通过采样得到的历史数据对新数据进行补充,有助于充分利用欠载场景中空闲的计算资源有效地训练推荐模型。针对用户偏好和物品特征的异质性问题,研究双翼混合专家推荐方法。该方法采用两个混合专家模型分别学习用户的偏好和物品的特征。同时,这两个混合专家模型中每个独立的专家模型,专注于学习一类用户偏好或物品特征,从而有效地学习异质的用户偏好和异质的物品特征。利用真实世界中用户与物品的交互数据进行实验验证与结果分析,通过比较推荐精确度,验证了提出的方法在欠载场景中的有效性。(3)记忆网络增强的多行为流式推荐方法。针对流式推荐场景中单一类型交互行为数据的稀疏性问题,研究多行为流式推荐方法。首先研究多行为学习方法,从多种类型交互行为数据中学习用户的近期偏好和物品的稳定特征。然后,研究基于注意力机制的记忆网络,有效地利用属于多种行为类型的交互数据维护用户的长期偏好。在此之后,研究用户偏好合并方法,融合用户的近期偏好和长期偏好。此外,研究流式场景下的多行为训练方法,捕获多种行为类型之间的相互影响,从而进一步提高流式推荐的精确度。利用真实世界购物平台中多种行为类型的交互数据进行实验验证与结果分析,通过比较推荐精确度,验证了提出的方法在具有多种行为类型的场景中的有效性。(4)面向流式推荐的响应时间优化的资源调度方法。针对流式推荐场景中负载强度容易发生波动、推荐方法需要的计算资源量不断变化的问题,面向云环境下计算量有限和计算量较为充足的两种场景,分别提出响应时间优化的资源调度方法,快速地满足流式推荐方法对计算资源的需求。具体地,在虚拟机放置过程中,面向计算资源较为有限的场景,研究基于时间感知分治策略的分支界限法,在节省计算资源的前提下对资源调度的响应时间进行优化;面向计算资源较为充足的场景,研究基于混洗的多维首次适应方法,实时地为流式推荐方法提供计算资源。利用真实世界的负载数据和仿真的负载数据进行实验验证与结果分析,通过比较响应时间和所需的资源量,验证了提出的方法快速调度计算资源方面的有效性。
其他文献
气浮导轨具有精度高、摩擦小和寿命长等优点,是高精密、高速运动领域直线运动基准构建的关键技术。但是气浮导轨存在刚度和稳定性相互制约、承载力和刚度普遍较低的问题,特别是在极端工况下,问题更加突出。因此,研究气浮导轨承载力、刚度和转动刚度的影响因素,对提升气浮导轨的性能,扩大其在高端制造装备及精密测量设备的应用具有重要的理论和实际意义。本文针对高速可变光阑系统中高速、高加速度扫描运动的气浮导向技术需求,
煤衍生碳黑可影响煤热解/燃烧过程中温度场分布及污染物形成;且大气中的碳黑对环境与健康都有恶劣影响,其产生机理一直为人们所关注。针对煤中离子可交换态Na(INa)与物理吸附态Na(ANa)对煤衍生碳黑的产生特性与理化性质的影响展开研究,可以揭示碱金属Na影响煤衍生碳黑形成的作用机理。因此,本文在对煤粉炉与层燃炉的现场测试研究中分析了燃煤锅炉PM2.5中的有机碳(OC)与元素碳(EC);又对原煤、酸洗
恶臭污染会造成人们居住环境的恶化,引起人体嗅觉器官的功能紊乱,已成为我国政府和民众关心的重要环境问题。乙硫醇是重要的农药中间体和石油天然气组分,是典型的挥发性含硫恶臭污染物,具有强烈的刺激气味和极低的嗅觉阈值,少量的废气排放就会对周围环境造成十分恶劣的影响。农药生产和石油化工企业排放的乙硫醇恶臭气体通常具有排放浓度高、间断性排放和污染物含量波动性大等特点,针对此类恶臭气体,构建高效率、低成本的处理
环境污染和能源危机已成为21世纪社会发展面临的两大挑战,半导体光催化技术能够以太阳能为驱动力实现废水中污染物的消除,还可将温室气体CO2转化为高附加值的化石燃料,被认为是解决以上问题的理想途径。但高效率光催化剂的开发仍存在载流子复合速率快以及氧化还原能力不足等问题。因此,如何从动力学上改善光生载流子的传输与分离能力,并有效增强催化剂的氧化还原能力是高效光催化剂开发的关键。近年来,从仿生学角度出发,
平台惯导系统具有精度高、稳定性好、对核辐射等外界干扰因素不敏感的优点,广泛应用在长航时高精度的系统中,特别是在战略导弹中。为提升战略导弹命中的精度,就必须要提高平台惯导系统的精度。目前,相关科研人员主要从两个方面来提升惯导系统的精度,一是采用先进材料与热处理技术,并改进零部件的加工、制造与整体装配工艺,二是提升惯导系统的标定精度并采取必要的补偿措施。在惯性仪表的制造工艺的研究,需要考虑温、湿度等环
伺服电机系统传动链广泛应用于风力发电、数控机床、重型机械等领域,但实际场合中由其故障带来的设备不能正常运转的现象屡见不鲜。近年来,“智能制造工程”的推进对设备的可靠性及安全性提出了更高要求,可以说电机系统传动链健康监测及故障辨识能力已成为下一代高档伺服驱动器的显著标志之一。因此,故障诊断与健康维护技术也迎来了新的发展契机。基于电机驱动系统的诊断方法,利用电机驱动器自身作为智能传感器,通过驱动系统获
相较于基于硬质材料的传统机器人,采用软材料或柔性结构的软体机器人具有更好的仿生特性、更高的运动自由度和更好的环境适应性,可以在狭窄的空间内运动,并在承受外部冲击后不产生结构及功能的破坏。基于所使用的材料及结构的特点,软体机器人还能够实现自修复、自传感、自组装等功能。已报道的软体机器人大多利用能够产生主动可控变形的智能材料与结构进行驱动。虽然每种智能材料或结构在应用于软体机器人时具有自身的优势,但在
第5代(The fifth generation,5G)移动通信技术为我们的生活和工作提供了高速稳定低时延的通信服务。在第5代移动通信技术中,为了在有限的无线资源情况下,获得更高的通信性能,我们需要采用频谱利用率更高的无线通信技术。多输入多输出(Multiple-Input-Multiple-Output,MIMO)方案是其中一种可以提高频谱效率的核心技术。在MIMO方案中,最重要的技术之一是预编
历史城市可以视作文化景观的一种类型,它不仅是文化和自然两方面价值、属性及特征在“人地互动”过程中层层积淀的产物,更是当下城市居民的生活场所。然而,城市人居环境与其历史意义之间的时空联系被缺乏管控的全球化与城市化进程所割裂,导致地方特色逐渐丧失,人们对城市的归属感和认同感也不断削弱。同时,遗产保护与城市其他方面发展之间的失衡,又使得遗产地居民的生活品质遭受严重影响。进入21世纪以来,“景观方法”逐渐