付费搜索中基于广告关系的点击率预测

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:iloveyouguoran
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网的飞速发展,互联网广告作为互联网公司的主要盈利模式也得到了工业界和学术界的广泛关注。与传统广告不同的是,互联网广告可以利用数据挖掘,信息检索和机器学习等技术进行定向投放,从而得到更好的广告效果。搜索引擎上的关键词广告(也称作付费搜索)是信息检索里重要的研究对象。它的一个主要任务是通过分析用户的行为来预测他们对广告的兴趣(通常用点击率来表示),进而选择最合适的广告进行展现。   之前点击率预测的研究将单个广告作为输入,并忽略了它和其他一起出现的广告之间的关系。这种独立性假设在实际系统中并不一定成立。在本文中,我们首先检查了同一个广告,在同一个搜索词下的同一个位置,但是和不同的广告一起出现时的点击率。我们发现大多数时候点击率变化非常大,证明广告之间的关系很大程度上影响了广告点击率。从这种现象出发,我们对广告之间的关系和它在点击率上的作用进行了深入的研究。主要工作总结如下:   1.为了验证和了解广告之间关系对点击率的影响,我们对搜索引擎的广告点击数据进行了统计分析。通过检查同一个广告,在同一个搜索词条下的同一个位置的点击率在和不同的广告一起出现时的标准差,我们发现这个点击率变化非常剧烈,说明关系对点击率的影响在真实数据中普遍存在。进一步的,通过分析和点击率的相关性,我们发现其他广告的质量对当前广告的点击率并没有明显影响,而广告的相似程度与点击率则呈现出非常明显的负相关关系。   2.利用数据分析的结果,本文提出了一种基于连续型条件随机场的点击率预测模型。我们用条件随机场的点特征函数和边特征函数来分别表示单个广告的内在特性和广告之间的关系。并利用极大似然估计方法对模型中的参数进行快速学习。同时,由于在推导过程中存在着闭式解,模型求解的时间复杂度和传统的点击率预测模型一致,可以满足实际付费搜索系统对效率的要求。为了验证效果,我们在商业搜索引擎的广告点击数据上进行了实验。结果表明,通过使用广告之间的关系,点击率预测模型可以得到大约20%的精确度提升。根据作者的了解,这是在点击率预测问题中第一个考虑了广告之间关系的研究工作。   上述工作已发表在2012年的国际互联网搜索和数据挖掘大会(WSDM)上。作者也给出了付费搜索中使用关系点击率预测的原型系统的设计。
其他文献
随着计算机的广泛应用、传感器技术的不断成熟和人机交互领域的长足发展,越来越多的创新计算技术和新型传感器技术被应用到人机交互领域,产生了丰富的多通道人机交互技术。同时
格基归约是格理论研究的一个重要内容,许多格上问题都通过归约来求解。LLL归约算法能够在多项式时间内找到格的一个短向量,该短向量的长度不超过格中最短向量长度的2(n-1)/2倍,
基于网络的三维地形交互式实时绘制技术在虚拟战场、三维地理信息系统、三维网络游戏中有非常重要的应用。本课题是基于网络的大规模地形交互式实时绘制系统的一部分,主要研究
目前世界上掀起了物联网研究的热潮,物联网发展己正式列入中国国家发展战略,各级政府高度重视,纷纷建设物联网示范工程,相关产业迅速涌现,从业人员迅速增长。军工企业安全生产监管
由于智能监控、数码摄像机、视频编解码、人机交互等多个应用领域广泛的需求,人脸相关的研究逐渐成为了国内外的热点。人脸检测与跟踪是人脸研究中两个重要的方面。人脸检测是
随着互联网的快速发展以及各类智能终端的不断普及,家庭或工作局域网环境下的各类终端设备也逐渐增多。为了充分利用各类设备,提升用户体验,多屏互动等跨设备使用硬件资源的应用
目前大多数人脸识别的算法都是基于灰度图像提出的,即使对于彩色图像,也是先转换为灰度图像,再进行人脸识别的。目前研究已经证实,彩色信息对于人脸识别提供了重要的信息,当人脸图
随着集成电路技术的发展,芯片技术得到快速的发展,计算机技术也发展到有史以来的最高点,计算机也日益普遍成为人们生活的一种工具,它以快速、方便、易用著称。但同时它的功耗问题
随着现代网络通信技术的发展,信息安全问题日益突出。智能卡作为一种便捷的工具,在应用系统中主要扮演着两个重要的角色:身份性和安全性。这使得智能卡一方面可以方便地识别出系
随着信息技术的迅猛发展,人们在享受信息系统所带来的巨大利益的同时,也面临着信息安全问题的严峻考验。其中,重要信息系统的安全尤为重要,若其安全性受到破坏,将严重影响社会秩序