【摘 要】
:
互联网商业的广告业务一直是其重要收入业务之一,而广告的点击率(Clickthrough Rate,CTR)往往是广告主和广告平台做出决策的重要参考标准。无论是对于互联网商业平台还是广告主,要获取利益最大化,就需要尽可能的将广告投放到产生较高点击频率的曝光机会上;而对于用户来说,过多无关杂乱的广告会极大的降低体验度,导致不满情绪激增。所以准确预测广告点击率有助于企业平台对广告的精准投放,增加广告主获
论文部分内容阅读
互联网商业的广告业务一直是其重要收入业务之一,而广告的点击率(Clickthrough Rate,CTR)往往是广告主和广告平台做出决策的重要参考标准。无论是对于互联网商业平台还是广告主,要获取利益最大化,就需要尽可能的将广告投放到产生较高点击频率的曝光机会上;而对于用户来说,过多无关杂乱的广告会极大的降低体验度,导致不满情绪激增。所以准确预测广告点击率有助于企业平台对广告的精准投放,增加广告主获取广告收益的机会,提升用户体验度。因此,CTR预估模型受到越来越多商家企业和研究人员的重视,逻辑回归模型作为点击率预估的基础模型。而广告业务数据往往存在数据量大、维度高和难以挖掘特征之间相关联系的问题。如何从复杂庞大的广告数据集提取出有效特征,选取高效准确的模型来提高点击率预测,是当前很多商家企业和研究人员容易忽视的问题。本文以此为背景,针对广告投放过程中CTR预估业务的问题,在常用的逻辑回归模型进行预测的基础上,提出基于XGBoost和LightGBM集成学习模型,设计实现了一套广告投放原型系统。具体研究内容如下:(1)本文使用某著名互联网科技公司的真实广告投放数据集作为基础数据集,从全局对数据进行了处理,并以图表的形式展示分析,在处理的过程中,清洗缺失值和异常值;(2)本文对原始数据集做深度挖掘,从广告、用户、用户——广告关联三个角度进行特征工程,将原本的33个特征扩充至156维。为防止特征过多发生过拟合现象,本文使用LightGBM算法对特征重要性进行筛选;(3)本文使用LightGBM和XGBoost两种经典分类模型分别构建广告点击率预测单模型,并使用Stacking进行模型融合。经过实验,对比logloss值,发现融合后的结果相较于单一模型的预测效果有较明显的提升;(4)本文基于广告点击率预测模型,设计并实现了一套针对广告CTR预测领域的广告投放系统。系统主要功能为预测广告被用户点击的概率进行广告库划分、进行个性化广告投放和系统管理等。本文旨在通过尝试开发机器学习和商业广告投放系统相结合的方式,将机器学习技术应用于商业广告系统中,从而实现辅助企业广告平台进行广告CTR预估,基本实现广告主获得营销收益、广告平台获得更高的广告收入、用户得到个性化推荐服务的三赢局面。实验结果表明融合后的CTR预测模型准确率较高,在广告点投放系统中提高了商业价值和预测准确性。
其他文献
中药虎杖为蓼科植物虎杖的干燥根及根茎,具有抗肿瘤、抗菌、抗炎和抗病毒等多种药理活性,因此在临床上得以广泛应用。目前,大量研究表明虎杖提取物(PCE)具有显著的抗炎作用,但是关于从中药多组分复杂体系中筛选潜在抗炎活性成分的方法却鲜有报道。另外,白藜芦醇(RES)作为PCE中主要抗炎活性成分,因水溶性低(0.03 mg/m L)、化学稳定性差以及体内半衰期短,导致口服生物利用度低,临床应用受限。通过剂
随着我国交通事业的快速发展,公路隧道工程的数量和里程数都在节节攀升,隧道建设技术也发展到了新的高度,但与此同时隧道建设和运营期间遇到复杂地质条件时,其稳定性与安全性也在遭受着很大的挑战。富水岩溶地区隧道衬砌背后高水压力是引起隧道病害的重要原因之一,尤其是在隧道运营过程中,随着岩溶地质的发育,加上排水不畅时形成强大的高水压力,极易导致隧道衬砌的破坏,严重时会危及到隧道的安全运行。鉴于此,本论文以重庆
在自古以来的园林景观设计中,光与影的应用屡见不鲜,它的参与使园林景观更显生机与活力,使景观层次更加动态多变。但是长久以来,光影在园林空间中的表现特点及作用并未得到系统、有效的研究。反观在众多现代园林景观建设中,只重视了实体要素的设计,而忽略了声、光等自然要素在景观设计中的作用,导致大量的匀质空间的出现,缺少了光影的调和使空间变得呆板无趣。直到近年,随着人们审美需求的提高,光影在园林中的运用才逐渐得
当下正值TOD(公共交通为导向)、POD(步行系统)、紧缩城市(Compact City)、高密度建筑学(High-Density Architecture,)、安全城市(Safe City)、高效空间整合(Efficient Space Integration)等背景下,地铁换乘站已逐步成为城市节点、开放网络结构的要素。尤其是城市中心区地铁换乘站,其站点内部人群高度聚集,具有客流量波动性和客流行
城市水体黑臭导致原有生态环境功能退化,而城市中黑臭水体问题往往高发于城市中心地带,用地成本高,因此寻找一种高效的原位处理方式就显得尤为重要。尽管生态浮床作为一种投资费用低、运维管理方便的原位水体治理技术,在近40年来得到了广泛的研究,但生态浮床的普及受限于其处理效果。本文以轻度黑臭水体为研究对象,采用外加填料的方式建立了增强型生态浮床装置,对填料进行筛选,并对增强型生态浮床修复黑臭水体的最优工况进
近年来,我国农村生活污水排放量正不断增加,而大量未经处理的污水被直接排放,对生态环境造成巨大的危害。因此,研发因地制宜、低耗高效、管理简便、能将污水合理回用的农村生活污水处理工艺势在必行。针对农村生活污水特点,从节能降耗的角度考虑,提出多级AO-人工湿地组合工艺。多级AO在传统工艺基础上进行了改进,利用重庆地区的地形高差大的特点,采用跌水复氧的方式,并投加悬浮球填料构建稳定的生物膜系统。在发挥其对
热电联产系统消耗一种能源同时生产电能和热能两种品类能源,具有较高能源利用率。家用微型热电联产系统(micro-combined heat and power,m-CHP)安装于用户附近,降低了输配过程中能量损失,进一步提高了能源利用率,被视为降低住宅能耗和二氧化碳排放量的一种能源供给系统。为了分析该系统应用于中国城市住宅的可行性,本文以哈尔滨住宅采暖为例,仿真分析了家用微型热电联产系统的经济、能耗
随着科技的发展进步,人类可以在月球上进行生物培养,但在月球表面恶劣的环境条件下使生物存活具有相当大的难度,其中恶劣的温度条件是主要的限制因素之一。嫦娥四号着陆器上搭载的月面微型生态圈生物科普试验载荷(以下简称“科普载荷”),作为人类首次在月面的生物生长培育试验,其内部温度的控制是通过热电制冷技术实现的。本文对科普载荷的热控模块进行了设计,并通过模拟和热平衡试验来分析是否能够在月面温度极端恶劣的条件
全球对材料可持续性的认识增加了对生物基聚合物(如聚乳酸)的需求,由于其对环境的影响较小,它们被视为石油基聚合物的理想替代品。聚乳酸(PLA)因其原料可再生、生物可降解以及生物相容性好等优点而成为一种倍受青睐的绿色环保高分子材料。然而在实际应用中,PLA存在加工温度偏高而导致的水解降解、氧化降解等问题。开发可低温加工PLA有利于促进和拓展PLA的应用。本论文以开发低成本可低温加工PLA为研究目标,探
近年来,在工程建设中越来越多地遇到土石混合体这一类松散岩土介质系统,人们对土石混合体的了解与认识还不深入,加上其本身力学性质的复杂性,土石混合体围岩对隧道的施工安全和长期稳定性都有着较大影响。论文以实际工程为依托,通过室内试验、理论分析、数值模拟相结合的方法进行研究,主要研究内容如下:(1)对土石混合体材料现场取样,实验室进行筛分、配比,使用压缩试验得到不同压力下纯土试样以及土石混合体试样的密度,