论文部分内容阅读
精准投放是网络广告今后的发展方向,这就要求广告研究者进一步改进网络广告投放算法。研究发现,广告内容越符合用户兴趣,越能改善用户体验,从而提高点击率,进而促进网络用户、广告商及搜索引擎提供商之间的利益统一。内容定向广告的基本思想是提炼用户感兴趣网页的主题,再投放与该主题相似的广告。这在一定程度上把广告主题和用户兴趣匹配起来,具有广泛的应用价值。然而,目前内容定向广告对文本主题的分类研究还很少,这就导致用户分类比较笼统,同时广告投放的精准度也亟待提高。广告所宣传的产品或服务往往由实体店经营。而同一家连锁店在不同地理位置可能有截然不同的运营团队和活动。一方面,用户可能只对某一区域的服务或产品感兴趣;另一方面,广告商也更愿意通过地理位置突出自身广告。因此,在广告投放时考虑地理位置对提高广告投放的精准度有着重大意义。要实现基于地理信息的内容定向广告投放需要解决以下几点关键技术:(1)只有网页与地理信息相关,投放广告时考虑地理信息才有意义,因此需要一种判断网页是否与地理相关的技术;(2)对于不同的广告和网页,需要衡量其地理相似度和文本相似度;(3)对于海量的广告与网页,需要快速对两者进行匹配。本文对目前地理信息处理和内容定向广告投放相关的技术进行了研究,提出了一个新的基于地理信息的内容定向广告投放模型。具体来说,包含以下方面:第一,针对可能包含地理关键词的网页,本文提出了判别网页是否与地理信息相关的一种分类方法。第二,对于同一个网页或广告,可能存在多个地理位置,本文提出了一种新的基于地理位置频数和地理位置包含关系的地理范围分配方法,由此可为每个网页和广告都分配一个地理范围,提高地理信息匹配的准确性。第三,在文本匹配方面,本文提出了一种新的基于扩展词的关键词权重计算方式,可以有效提高匹配准确性并降低关键词向量的维度。第四,针对海量网页和广告,本文还提出了两种模型,通过文本聚类和网页地理信息的过滤,能够高效投放广告。本文对上述模型和方法进行了相关实验。实验结果表明,本文提出的结合地理信息的内容定向广告投放算法具有较好的召回率和准确率。本文的检索模型能有效提高广告投放性能。