基于深度学习的CTR预估算法研究

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:wskiqpk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网广告已经成为了互联网公司的主要收入来源,而其中广告点击率的预估是最重要的工作,提高广告点击率的准确率能直接为公司带来收入。广告日志数据和图像或者音频的连续特征不同,广告数据是离散的,高维的,他们之间的依赖性很小。目前像百度、谷歌等公司主流的方法是线性模型加大量的人工特征,而这种方法越来越难以为继,因为大量的手工特征需要耗费大量的人力,而收益提升不大,原因是这些特征线性模型不能学到特征之间的非线性关系。采用常规的深度学习模型,由于输入的特征的超大空间导致大量的计算,导致深度学习网络无法收敛。为了解决上述的问题,本文提出了一种新的深度学习模型,能够处理大量稀疏数据,并能够有效地学习到数据中的非线性特征,大规模实验和真实的数据表明本文提出的模型能够显著提高准确率和召回率。本文的研究工作集中在以下四个方面:第一:改进数据嵌入算法,针对真实数据ID类数据特别多的特点,研究改进嵌入算法,使得原始数据在经过嵌入算法后不会出现损失,并且降低输入向量的维度,使得深度学习可以处理。第二:改进深度学习模型BFNN(Boosting tree Factorization-machine supported Neural Networks),基于提升树和因式分解机的神经网络,由于真实数据具有高维非线性的特点,本文提出的深度学习模型,可以有效学习数据中的非线性特征。第三:研究深度学习模型与浅层模型在点击率预估问题上的区别。第四:验证BFNN在网络层数、网络结构、正则化和激活函数等方面改进的有效性。
其他文献
本文运用文献法对最大心率的推算、运动训练对最大心率的影响展开论述,可以得出如下结论:运动训练后,最大心率减小;停止训练后,最大心率增加;运动水平高者,最大心率低。由于,
为了解决橡胶工业生产中由于炭黑、白炭黑作橡胶补强填料时成本过高的问题,通过采用适当的改性药剂对粉煤灰进行改性处理,使改性后的粉煤灰能够部分替代炭黑作橡胶补强填料。
目的:使用结扎法建立稳定的大鼠经脉不通病理模型。方法:48只雄性SD大鼠按随机数字表法分为4组各12只。先测量任脉低电阻线(简称任脉线),结扎1组在任脉线上结扎1个点,结扎2组
新型农村合作医疗自2003年试点以来,理论界进行了大量的探讨。本文试图从农村合作医疗的现状、政府在新型农村合作医疗中的作用、新型农村合作医疗微观机制和运行绩效四个方
<正>泡椒凤爪是起源于重庆的汉族特色小吃,以麻辣有滋、皮韧肉香而著称。泡椒凤爪既能登大雅之堂,也为普通老百姓所喜爱。此款美食具有开胃生津、提神醒脑、促进血液循环的功
期刊
<正>我院自2000年10月以来,无选择地对120例上肢急诊手术病人在腋路臂丛阻滞麻醉穿刺技术和标准化相同的情况下,使用布比卡因药液中分别加用不同剂量的地塞米松,同时用浓度容
利用Matlab/Simulink建立了矩阵变换器双电压控制策略的仿真模型,验证了算法模型正确性;应用数字信号处理器(DSP)与复杂可编程编辑控制器件(CPLD)的组合结构,设计制作了矩阵
<正>阳虚质是指阳气不足,以虚寒表现为主要特征的体质状态。其成因与禀赋不足、胎养不当等先天因素及社会环境、生活习惯、疾病影响等后天因素密切相关。阳虚质发病易倾向于
<正> 根据一九七一年广州会议提出的转子发动机攻关计划和道路“可靠性试验要点”规定的要求。上半年开始分别由两辆钱塘江牌汽车进行了道路试验。5~#车装1公升单缸样机,额定
调节性T细胞(CD4+Treg)作为独立功能的T细胞群无可置疑,它具有抑制自身反应性T细胞的功能,是参与维持外周耐受的重要细胞群。