【摘 要】
:
得益于互联网和移动设备的广泛应用,以信息流形式为基础的电子商务平台和短视频平台正在占用更多的流量和用户时长。为了解决“信息过载”问题,个性化推荐系统成为了互联网厂商重点发展的核心技术。本文以多媒体推荐系统为研究课题,主要关注大规推荐排序算法中普遍存在的挑战,重点研究了利用深度学习和多模态学习解决用户冷启动,物品冷启动,小样本量等问题。主要内容分为三部分。第一,物品冷启动。物品冷启动指的是新的物品加
论文部分内容阅读
得益于互联网和移动设备的广泛应用,以信息流形式为基础的电子商务平台和短视频平台正在占用更多的流量和用户时长。为了解决“信息过载”问题,个性化推荐系统成为了互联网厂商重点发展的核心技术。本文以多媒体推荐系统为研究课题,主要关注大规推荐排序算法中普遍存在的挑战,重点研究了利用深度学习和多模态学习解决用户冷启动,物品冷启动,小样本量等问题。主要内容分为三部分。第一,物品冷启动。物品冷启动指的是新的物品加入推荐系统中,由于不存在过往的用户行为数据,导致系统无法准确将该物品推荐给合适的用户。而传统的推荐算法往往无法高效利用物品本身的多媒体内容信息,例如标题,描述,图片等,因此可以利用对物品内容的刻画预估对该物品感兴趣的用户。相比于对比方法,本文提出一种基于对抗学习的多模态学习方法,为冷启动物品的内容表达自动提升权重,从而提高了冷启动物品的推荐效率。该方法在Pinterest公开数据集上验证了有效性,在点击率和排序效果上均提升超过14%。第二,用户冷启动。用户冷启动指的是新的用户加入推荐系统中,由于系统缺乏其基本信息和过往行为数据,无法准确为其提供推荐。本文提出了一种混合兴趣表达模型,将用户对物品的兴趣分解个性化兴趣与半个性化兴趣,半个性化兴趣被表示成用户到不同群组的相似度与这些群组对物品的加权兴趣概率的乘积。并提出了一种可以端到端训练的用户兴趣建模模型,其中可以按批实现聚类。作为一个兴趣表达框架,混合兴趣表达模型可以融入当前主流的任意推荐算法,并通过用户群组建模推高其结果。该方法在2个公开数据集和1个工业界真实数据集上验证了有效性和普适性,大幅度提高对低活跃度用户和冷启动用户兴趣预估的准度。第三,小数据量场景下的多媒体推荐算法。深度学习尽管在数据量充足且标注准确的情况下,能够超过传统方法,但在数据量不足的情况下,决策树可能更为适合。本文为基于会话的推荐引入了一种称为TSE的新嵌入方法。给定用户的观看列表(会话)和目标物品,TSE将每个物品联合嵌入会话中,同时考虑会话中所有项目之间的相对位置和关系。这种嵌入方法使推荐系统可以对最近的观看项目进行更多加权,并挖掘用户的长短兴趣。同时使用多头注意力对序列嵌入再进行非线性变换。嵌入之后,推荐就归结为分类问题。通过创新的使用梯度提升决策树处理神经网络嵌入,TSE获得了更好的性能。TSE方法在2019年ACM世界多媒体年会和Hulu主办的基于内容的视频关系预测大赛中获得冠军。
其他文献
近年来无人机、无人小车等智能体因其稳定性高、适应性强、风险小等特点得到了快速发展;智能体集群化解决了单个智能体功能性有限的问题,发挥集群优势的同时对智能个体进行了有效的整合。集群避障一直以来是智能体群体控制的重要模块,大多避障算法在遭遇复杂障碍物环境时容易陷入局部最优值使得智能体无法快速进行障碍物躲避;本文根据智能体集群在障碍物环境任务执行过程中避障需要,对Flocking协同控制算法和Q-lea
随着移动智能设备与物联网等技术的飞速发展,人们的家庭生活水平也稳步提升,如今很多的家庭设备也变得智能化。分布式家庭娱乐系统以此为背景,而且基于家庭生活中的各种智能设备如智能电视、电脑、音响等等,探寻一种智能手机与各种家庭设备相互协作的家庭娱乐体系。在该体系下各种智能设备能够各司其职,如智能电视视听效果好、智能手机轻便易操作,因此分布式家庭娱乐系统解决了家庭设备之间的互联互通问题,且使得每一个设备都
近年来,随着人工智能、深度学习领域的发展,深度神经网络模型得到了广泛的研究和应用。其中,计算机视觉方面的研究也取得了突破性的进展,并有许多研究已经有了具体落地应用,这为人们的生活带来更多的方便。然而,对于神经网络的训练,往往需要基于大量的实验数据,而数据的提供方式在实验场景和实际场景有较大的差别。在实验条件下,数据往往是完整的理想化的,由人工直接提供。但在现实世界中,数据往往是随着时间逐渐提供的。
由于脑电信号反映了大脑神经的基本活动,所以能够客观反映出人的内在情感。然而在脑电信号采集过程中不可避免的出现伪迹,这将导致脑电信号质量不佳;以及现有的特征选择方法无法提取与情感相关的通道,从而将与情感无关的通道也参与脑电信号分类之中,这些结果都会导致脑电信号情感效果较差。为解决上述问题,本文以SEED数据集、DEAP数据集为研究对象,将稀疏化理论引入脑电信号情感分类之中,对特征提取选择和分类算法进
人类对于世界的探索已经不仅仅局限于陆地和海洋,而是将探索的方向转向了更为广袤的天空和宇宙,因此对各个国家在航空航天领域的技术实力提出了更高的挑战,国家在空气动力学领域的研究与进步也就显得尤为重要。空气动力学中在获取气动数据时仍依赖较为传统的方法,但此类方法的局限性较大,通常具有较高的时间或经济成本。而当前人工智能技术的蓬勃发展为空气动力学领域气动数据的获取方式的发展提供了新的契机。空气动力学领域传
人体动作识别作为视频分析中一个非常重要的组成部分,其已经在多个重要领域发挥至关重要的作用,包括视频监控、人机交互、自动驾驶等等。传统的人体动作识别主要基于RGB图像或视频,但由于尺度、光照变化以及背景噪声等因素的影响,效果不尽如人意。近年来,得益于深度传感器的发展以及人体骨骼关键点检测算法的成熟,越来越多的研究聚焦在基于骨骼关键点的动作识别算法上,并且开始使用图卷积对人体骨骼进行建模并加以分析。本
人工智能技术如今在诸多领域已经取得了巨大的突破,得到了非常广泛的应用,例如目标检测、图像识别和自然语言处理等。目前由于“数据孤岛”问题和愈发严格的隐私安全管控,人工智能技术面临着缺乏高质量训练数据的困境。由于联邦学习支持用户在不分享原始数据的条件下联合训练模型,能够汇聚更多分散的数据共同建模,因此逐渐成为人工智能研究领域的热点。然而,联邦学习环境中存在的数据异质性和系统异质性因素会导致模型训练效率
在多目标优化问题(multi-objective optimization problems,MOP)中,一个子目标的改善可能会引起另一个或者另几个子目标的性能降低。因此不存在同时优化所有目标的全局最优方法,而是存在一组能够权衡冲突目标之间的解决方案。演化算法(evolutionary algorithms,EA)由于其基于种群的特征已被广泛认为对多目标优化有效,算法以尽可能权衡各个优化目标来保持