基于因子分解机的点击率预估及转化研究与应用

来源 :重庆大学 | 被引量 : 0次 | 上传用户:tmac0000000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前计算广告中点击率预估与点击率转化研究主要面临样本选择偏差和数据稀疏性问题。因子分解机是目前主要用于实现大规模稀疏数据特征组合的热门算法,它最本质的特征是二阶特征交互。由于因子分解机能在较低复杂度下学习数据中隐藏的特征交互关系,当用于稀疏数据时,因子分解机比一般的多项式表达能力强。本文基于因子分解机模型进行了充分的扩展研究,并在计算广告领域的点击率预估和转化率估计的任务上进行了实验验证。本文主要内容如下:(1)考虑到目前的大多数方法建模特征的交互用于提高模型性能,但未注意到不同特征交互对模型的贡献度不同。本文提出了基于因子分解机的注意力混合模型,采用注意力机制探索不同类型特征组合对点击率预估的影响,有效缓解了大多数方法中没有综合不同特征组合对模型贡献度的问题。在两个数据集上的广泛实验表明,该模型不仅取得了与当前最优方法可比的性能,还有较强的泛化能力。(2)虽然因子分解机在推荐系统领域已获得了广泛的应用,但在面对存在图结构的数据时,因子分解机模型无法充分获取数据中的图信息。本文提出了基于图神经网络的因子分解机模型用于点击率预估任务,模型使用因子分解机和特征拼接两种方法初始化节点嵌入表示,使用两种不同的图神经网络对特征进行学习,通过有效结合图神经网络和因子分解机来进行点击率的预估。实验结果表明,该模型在所有对比模型中表现最好。(3)点击率预估是计算广告的主要任务之一,而转化率更是计算广告关心的问题,因此本文对转化率研究进行了探索,引入迁移学习并提出了图异构因子分解机模型用于点击率转化任务。模型同样使用因子分解机作为初始节点表示的方法,然后使用图神经网络同时对用户节点物品节点转移向量进行学习,从而有效建模点击行为转化到购买行为的概率,通过两个公开数据集验证了该方法的有效性,并在广告推荐系统上进行了应用。
其他文献
在深度学习领域中,卷积神经网络已经在图像分类、人脸识别、目标检测和语音识别等各种计算机视觉及自然语言处理任务中得到广泛应用。卷积神经网络的推理结果依赖于大量的网络参数及这些参数参与的复杂计算,这会限制它们在计算能力与存储空间有限的设备上的应用。因此,针对卷积神经网络的加速对人工智能的普及应用具有重要意义。静态网络在计算时计算图与网络参数都是固定的,这可能会限制它们的表示能力、效率以及可解释性。与静
学位
随着移动互联网的高速发展和移动设备的迅速普及,人们获得信息的渠道越来越多,其中以微博、Twitter、Facebook等为首的各大社交媒体平台逐渐成为了现代社会的消息集散地,社交媒体对于人类社会中信息的传播做出了巨大贡献,但其也正逐渐成为一把“双刃剑”,由于社交媒体的匿名性和平台缺乏有效的审核管理,平台中充斥着数量巨大的虚假新闻和各类谣言,这些虚假新闻在社交媒体的特性下迅速传播和发酵,无疑对社会造
学位
设备安全稳定运行关系到经济建设发展、人民生命财产安全和社会稳定,确保设备健康运转、有效预防事故发生已经引起越来越高的重视,数据驱动的人工智能和机器学习也正在为起重机械等典型工业设备的健康状态预测中提供技术支持。有关典型工业设备监测数据的预测任务在实际应用中面临极大的挑战性,首先是设备监测数据类型的多样性,其中包括温度、应变、振动、声音、转速、电信号等,不明显特征监测类别会影响状态预测的准确度。此外
学位
近年来,随着城市化进程的发展,国家经济快速发展,城市居民的生活水平不断提升。但随着城市规模扩大,城市人口逐年增加,也给城市建设带来了许多新的问题和挑战。比如,大量的城市人口流动给城市交通系统带来了极大的压力,造成了一系列交通问题和环境问题。与此同时,随着城市的夜生活越来越丰富多彩,城市居民的夜间出行需求日益增加,但是大多城市目前尚未规划夜间的公共交通系统。城市建设,交通先行。交通是城市发展的命脉,
学位
在传统医学诊断过程中,医生需要根据CT图像等数据对病人的身体情况做出准确判断,并及时制定对应的医疗方案。然而,相关CT标注数据的人工获取方法非常耗时费力,需要医生对大量切片图像手工勾画轮廓。人工标注数据重复性低,主观性强,分割结果因人而异。随着深度学习在多个学科领域的深入融合和发展,基于深度学习的医学CT图像处理技术展现出强大的优越性。本文基于大数据集下的腹部多器官图像分割任务,提出并实现了多种精
学位
随着图像大数据的兴起,图像中存在的语义信息也越加复杂。单标签分类已不能准确表述图像内容,因此多标签分类开始受到越来越多的关注,且成功应用于图像搜索系统、医疗诊断等领域。为进一步提高多标签模型性能,本文提出基于图注意力表示和基于自适应图模块的两种多标签图像分类方法,主要贡献如下:(1)针对现有的多标签方法只能粗略定位目标语义区域,且无法充分挖掘语义区域之间存在的标签相关性的问题,本文提出了基于图注意
学位
树木三维模型对虚拟城市,城市三维场景重建、构建数字孪生体有重要意义。通过提取树木点云骨架构建得到树木的三维模型是一种重要的重建方式。树木原始点云数据一般都存在点云数量庞大,密度不均匀,存在噪声点,以及点云数据部分缺失的问题。大多数传统算法在提取树木点云数据骨架时,会出现提取出来的骨架拓扑与原始树木拓扑不一致,以及骨架断裂或者骨架的居中性不佳的情况,从而不能够准确提取出树木骨架。如何解决这些问题,并
学位
推荐系统作为缓解“信息过载”的有效途径,已具有大规模的应用。其中,基于共同群体偏好实现个性化推荐的协同过滤是应用最广泛的技术,但其输入数据的不平衡和损失函数的不公平,使其容易遭受流行度偏差问题。即相较于非流行的物品,推荐系统过于倾向推荐流行的物品,导致推荐系统中的马太效应。流行度偏差对推荐系统的各利益相关者都有不利影响,因此,如何缓解推荐系统中的流行度偏差是亟需解决的问题。之前大部分研究只从物品方
学位
公钥密码学是网络空间信任链建立的基石,但近年来量子计算的快速发展严重威胁了ECDSA、RSA等经典公钥密码算法的安全性。研究抵抗量子计算威胁的密码学前沿分支——后量子密码学日益受到重视。美国国家标准与技术研究院NIST于2016年启动后量子密码算法标准化工作,目前该标准化工作已进入第三轮,共入围6个基于多个理论的签名算法,根据美国白宫国家安全备忘录该标准化工作将于2024年完成。随着后量子密码标准
学位
近年来,随着产品数量和网站访问者数量的快速增长,推荐系统面临的巨大挑战是如何更准确地为用户建模,并以此向用户推荐更合适的产品。尤其是当这些网站拥有用户大量的社交信息时,尽可能地利用社交信息来实现这一目标一直是一个重要的研究课题。使用社交信息的关键是将这些用户间的关系更好地集成到用户建模中,以便推荐系统能够学习到更精确的用户特征表示,进一步产生更好的推荐结果。为了更好地利用用户社交信息进行推荐,本文
学位