基于用户隐式行为的推荐算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:ZHAO289868538ZHAO
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字经济的迅猛发展,人与信息交互的日常化、普遍化,从信息匮乏的时代走向了信息爆炸的时代。在这个时代,如何从海量的多媒体异构数据中寻找到自己感兴趣的信息对于消费者来说变得越来越困难。与此同时,如何高效地寻找到目标用户转换服务价值对于信息投放者来说也变得异常困难。由此,注重用户的个性化需求以及能够盘活长尾资源的个性化推荐系统应运而生。然而,随着平台化经济的快速发展,用户在平台内与物品的交互呈现多样化,传统的基于用户显式反馈(如对电影1.5的评分)的推荐系统已然不能适应当下各种场景需求。如何能够有效地利用用户浏览、点击、签到等隐式行为挖掘用户真实意图是现阶段推荐系统更重要的问题。基于此,本文针对现阶段推荐系统用户行为隐式化、场景化的特点,围绕数据稀疏性、序列化和多行为融合等问题展开研究,主要工作与贡献如下:
  针对用户隐式行为数据稀疏的问题,提出了一种基于隐式反馈的协同深度排序算法。该算法通过将物品辅助信息的抽象表示集成到成对排序模型的贝叶斯框架中,使得物品的表征更加准确,从而提升推荐效果。具体地,为了解决现有主题模型提取方法只能提取浅层的物品特征而且无法有效地提取特征之间的关系的问题,采用堆叠去噪自动编码器提取物品文本深度特征。然后,正则化约束物品深度特征和物品潜特征,从而联合用户隐式行为和物品辅助信息。一系列的实验结果表明,协同深度排序模型在所有稀疏度级别上在召回率指标下都优于三种现有的方法。
  针对线性加权用户长短期序列偏好建模能力不足问题,提出了一种层次化的注意力交互模型提升推荐效果,解决推荐系统中预测下一个用户感兴趣物品的任务。具体来说,首先将用户和物品嵌入到低维稠密空间中,然后使用两层注意力网络模拟用户动态的长期品味和序列行为。我们的模型不仅考虑了长期和短期偏好中的用户动态属性,还考虑了用户和物品、物品和物品之间的高层次非线性的交互。从实验中,可以观察到我们的模型在两个真实数据集Tmall和Gowalla中都优于现有的方法。
  针对基于位置服务场景下连续兴趣点推荐中序列的不对称性和时间上下文相关两个问题,提出非对称投影的时间感知度量嵌入方法用于连续兴趣点推荐。首先,从公开数据集中发现用户连续签到数据中兴趣点-兴趣点序列存在不对称性以及用户对下一个兴趣点的选择依赖于时间的特性。基于此,设计了一种新颖的非对称性投影时间感知度量嵌入算法,将兴趣点-兴趣点,兴趣点-用户和兴趣点-时间的关系嵌入到三个不同的潜在欧几里德空间中。最后,在两个真实的公开数据集上进行了实验评估模型推荐效果。实验结果表明,我们的方法在精度和召回率两个指标上优于现有的方法。
  针对基于位置服务场景下多种用户交互行为并存的现象,探索多种隐式行为之间的关联性,提出了一种联合学习框架增强推荐性能。具体来说,在基于位置服务的场景下,利用用户签到行为和地图查询行为数据,提出了多行为融合的个性化兴趣点推荐算法。首先从多行为数据中构建三种上下文关系图捕获签到兴趣点-查询兴趣点,用户-查询兴趣点和签到兴趣点-签到兴趣点的关系。然后,基于SkipGram模型设计了一种网络嵌入方法,从图中学习多视角的用户和兴趣点表征。此外,采用成对排序方法估计用户签到兴趣点的概率。最后,所提出的模型将这两种方法融合在一起,通过联合学习优化模型参数。最后,一系列的实验证明我们的方法与其他方法相比在四种不同的指标下都具有优越性。
其他文献
随着计算机技术的快速发展,互联网积累了海量的时序数据,如问答数据、社交网络数据和电商交易数据等。如何对这些时序数据中内隐因素之间的交互进行建模,理解个体用户或群体用户在时序数据中所蕴含的意图和行为,是当前人工智能领域研究的热点和难点。本文以问答系统中时序数据理解为研究对象,提出了若干算法模型并进行验证。  一般而言,问答时序数据中丰富的内隐交互信息可以分为结构时序交互和语义时序交互。结构时序交互表
学位
随着云计算、大数据和物联网等信息技术的飞速发展,全球数据呈现出海量集聚的特点。这些从不同来源所获取的海量数据反映着人类社会的生活和规律,如群体出行和交通流量。因此,如何对多源数据进行分析与理解,以更好地全面了解这些多源数据所蕴含的丰富信息,是一个值得研究的重要问题。  多源海量数据本质上是序列数据,这些从不同来源获得的序列数据之间相互补充、彼此交互,刻画着人类社会中群体的行为习惯和生活模式。本文针
学位
问答系统是体现人工智能的一种通用方法,是自然语言处理领域非常重要的一个方向。随着多种媒体数据的积累和深度学习在各个领域取得的突破性进展,跨媒体智能给问答系统带来了新的机遇和挑战。以视觉问答为典型代表的跨媒体问答方向得到了广泛的关注和研究。  视觉问答(Visual Question Answering,VQA)是回答关于图像问题的任务,输入为一幅图像以及关于该图像的开放自由的自然语言问题,输出为文
学位
图像及视频数据包含大量的视觉信息,人类可以利用这些信息进行学习和推理,进一步理解活动规律和社会行为。随着数据的海量涌现,如何从获得的海量冗余的视觉数据中甄别和遴选出关键视觉信息,并为后续视觉语义内容理解和分析提供支持,是当今计算机视觉领域所关注的热点问题,具有十分重要的研究意义。  在这些热点研究中,如何在去除图像、视频数据中冗余背景信息基础上,甄别发现具有丰富语义信息的视觉目标物体,即显著性目标
由于影视和游戏制作等领域的需求驱动,三维人脸重建一直是计算机图形学中重要研究方向。与设计师人工建模不同,三维人脸重建主要从输入数据中自动塑造人脸几何。输入类型主要有:2D数据(图像或视频),2.5D数据(立体图像或视频、深度图),3D数据(点云、网格等)等。其中基于单张图像的三维人脸重建输入设备最简单,输入数据量最少,互联网上的素材量最大,因此在面向普通用户的消费级的应用中也最具有潜力。近年来,随
三维重建是计算机视觉中的研究内容之一。准确快速地获取场景中的三维信息(深度)在逆向工程、机器人、导航、增强现实等领域中有着重要作用。在获取场景深度信息的方式上,相比于较为昂贵的激光雷达、结构光扫描仪等仪器,被动式立体匹配方法通过较为廉价的设备(双目相机)即可获取相对较高精度的深度信息。本文借鉴深度学习、数理统计等理论和方法,深入研究了相机标定以及双目立体匹配算法,并将其用于高精度三维人体模型重建。
人体的视觉感知与理解在安防监控、自动驾驶、人机交互、视频内容分析等方面有诸多的应用前景,因而一直是计算机视觉领域的重要研究课题,受到工业界和学术界的广泛关注。多年来,研究员们围绕这一课题中的关键技术展开研究,并取得了丰硕成果。然而,目前的技术研究大多是聚焦于其中的主流问题,技术覆盖不够全面,将这些技术落地到实际应用场景时,尚存在一些诸如恶劣光照条件下对人体的检测定位不够理想,对人体细粒度行为的识别
学位
使用消费级、低精度的深度相机对三维物体进行快速重建,在智能机器人、自然人机交互等领域具有重要的应用价值。由于消费级深度相机所采集的深度图像精度较低,噪声较大且易产生孔洞,如何实时、交互式、高保真度地重建真实场景的三维模型仍具有一定的技术挑战性。本文对基于稠密深度数据的实时相机跟踪与高精度表面重建进行了深入研究,对三维重建流程的几个关键环节进行了改进和提升,形成了解决方案。主要工作如下:  (1)针
学位
高光谱数据(图像)不仅包含目标的二维空间结构图像,也记录一维几十到几百个波段光谱响应曲线,分别描述目标的空间地物分布和详细光谱特征。高光谱图像上述独特的特性增加了其表示和重构的难度。如何通过恰当的模型假设,把高光谱图像内在的结构抽象为数学模型,有效利用空间信息、谱信息以及空谱联合信息是高光谱图像处理的关键。  高光谱数据是高维数据。低秩和稀疏表示是刻画高维数据低维结构的重要方式。稀疏和低秩假设有助
基于大数据驱动的图像转换技术是图像合成、虚拟现实和机器学习等领域中的重要研究内容,其研究进展在刑事侦破、文化娱乐及航天遥感等方面有着重大的应用价值。尽管计算机视觉领域在最近一些年取得了巨大地突破,但在一些具体的视觉任务中依然还有很长的路要走。对于图像之间的转换来说,如何建立不同域之间图像流形上的映射是一个比较难处理的问题。对于人类视觉来说,图像的理解与生成过程可以认为是人类眼球视觉细胞对于光线敏感
学位