论文部分内容阅读
随着网络的快速发展和普及,网络广告作为新兴的广告产业也随之兴起。网络广告的投放方式日新月异。本文研究两种主要的网络广告投放方式:赞助搜索广告和内容定向广告。赞助搜索广告在网页浏览体验中已成为一个很重要的部分。广告展现的顺序很大程度上影响了用户对广告的浏览和点击。广告的排名部分依据本次搜索获得的最大收益,此外展现用户喜欢的广告会提高用户的满意度。基于以上因素,准确地预估广告的点击率十分重要。本文主要做了以下研究工作:(1)研究了赞助搜索广告点击率的预估。在计算广告数据的标签时,广告的点击率不仅与广告的内容有关,还取决于广告展现的页面和所处页面的位置。综合考虑以上因素,本文采用最大似然估计方法来计算数据集中广告的点击率。本文采用了三种特征选取方法,分别为信息增益,卡方统计和RReliefF算法。对于点击率预估的回归算法,采用了三种回归算法:逻辑回归模型,支持向量机和梯度增强决策树。并对这些算法进行了对比分析。实验表明,RReliefF算法在预估广告点击率的准确率上的表现要明显优于另两种方法,并且梯度增强决策树和支持向量机表现的性能都很好,且梯度增强决策树更胜一筹。(2)研究了内容定向广告投放。本文基于内容定向广告的特性提出了一种新的算法—BM25的改进算法。该算法在BM25算法的基础上加入了词汇扩展,进而减少文本的长度,提高匹配的精度和效率。实验表明,对比于向量空间模型和传统的BM25算法,BM25的改进算法较好地解决了网页内容与广告文本的失配问题。综上所述,针对赞助搜索广告点击率的预估,本文使用了不同的特征选取方法和回归算法,并在不同的数据集和特征数量上进行了对比分析,并得到了有意义的结论。而针对内容定向广告的投放算法,本文提出的BM25的改进算法在一定程度上提高了网页与广告的匹配质量。