基于可扩展分解机器的搜索广告点击率预估

被引量 : 0次 | 上传用户:guanyuefei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索广告通过用户的检索行为触发广告的生成,是目前互联网流量变现的主要模式之一。搜索引擎一般按照广告的点击率(Click-Through-Rate, CTR)和广告的出价之积来筛选广告,其中CTR预估是核心问题之一,它对搜索引擎的收入和用户的体验都有重大影响,点击模型是预估CTR的主要方式。但是,由于搜索广告数据量大,特征维度高且长尾现象明显,目前大多数点击率预估系统无法高效的在如此大量的稀疏且高维的数据上准确预估CTR。因此设计恰当的特征体系,建立高效可扩展的点击模型,并且利用在线优化算法快速迭代成为急需解决的三个问题。本文的主要工作如下:1.提出点击率预估特征设计原则,基于此提出五组特征,包括从用户,广告,以及环境三个维度,由单特征到组合特征,统计特征等多粒度的特征集合;2.设计了用作点击模型的可扩展分解机器SFM,利用维度树结构将分解机器所基于的切片张量分解重构成层次切片分解。由于利用了层次结构,不仅模型的空间复杂度大大下降而且方便了在线算法的设计,此外,借助于分解模型,模型能在长尾数据上更准确的预估参数,利用proximal gradient方法,在线工作集优化算法能更快收敛。3.基于真实搜索广告日志数据进行了三组实验来模拟线上CTR的预估,结果表明,CTR特征体系能够有效提升模型对搜索广告点击率预估的准确度,SFM相比FM能够有效降低模型的存储空间,online策略的工作集算法比batch策略能更快的收敛到局部最优解,在点击率预估方面,SFM在高频和长尾搜索日志数据上的CTR预估准确度以及排序能力均于好于作为基线模型的分解机器,Logistic Regression模型和User Browsing模型。
其他文献
世界性城市灾害的加剧已成为城市化进程中的一大障碍,它也是城市化过程的产物。如何协调城市化过程与城市综合灾害风险管理,已成为当今世界、特别是像中国这样的发展中国家可
软土的成因不同,其工程性质存在着一定的差异,路基的固结沉降也不一样。为了研究寒区湿地软土固结变形特性,弄清其固结和次固结系数变化规律,对两类软土进行了单向固结压缩试
针对某型机载电子吊舱维护训练成本高、组织难、周期长等问题,设计实现了一种基于半实物仿真的维护训练系统,该系统不仅在外观、连接和操作上与实装一致,同时在内部设计了信
当石油的主要使命由照明转变为动力,石油工业很快就成为新型的工业部门,机械钻井技术也就应运而生。为了高效地驱动井底钻头旋转破岩,人们由地面驱动技术想到了井下驱动技术,井下
工业微生物育种是运用遗传学原理和技术对某种具有特定生产目的的菌株进行改造,去除不良性质,增加有益新性状,以提高产品的产量和质量的一种育种方法。工业微生物的育种技术
2005年至2008间,是个特殊的时间段,中国经济形势不是很稳定,金融危机席卷全球,这样的环境考验着中国银行业,但这在四年,中国四大国有银行纷纷改制、上市,极大的改变了中国银
风能作为一种绿色无污染的可再生能源,具有非常高的开发价值和商业价值。风力发电也成为了最可能接近替代常规发电的一种可再生能源利用。过快的发展给我们带来可观的经济效益
随着云技术的不断成熟与发展,为了降低信息化的成本,企业采用的云服务的种类与数量与日俱增,企业信息化进程已经步入“云时代”。与此同时,企业信息集成方式将面临全新的挑战
“挑战自我、寻求冒险、富于探索精神”是胡锦涛总书记06年1月9日在全国科技大会上提出的建设创新型国家对创新人才培养的基本要求。随着时代的发展,当代大学生对知识的学习
1974年出土于洛阳的"繁阳之金"青铜剑铸工精巧,装饰华美,尤以其从部四字铭文,令人注目:其一,先秦古繁阳有二,究竟应为何处;其二关于"金"的真正含义;其三,衣冠带剑的具体功用.