基于卷积语义模型的搜索广告系统研究与实现

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:firefly_xk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的高速发展改变着人们的生活方式,层出不穷的服务不仅方便了人们的生活,也颠覆了原有产业。“互联网思维”这个名词也不断被人们提起。互联网产品和服务获得了流量和数据,而如何将这些流量和数据变现是“互联网思维”的关键所在。搜索广告,是在线广告中规模最大、增长最为迅速的广告形式。搜索引擎拥有大量的用户数据和流量,因此互联网公司迫切地希望通过搜索行为的指导来将这些数据流量转化为实际的商业利益。因此搜索广告的核心目标是根据用户的搜索词,来预测用户的搜索目的并投放相关广告,保证广告主与广告系统的利益,并实现用户、广告主与广告系统三方共赢,在搜索广告中,单纯考虑某一方的利益都是不可取的,搜索广告的投放是三方博弈后的共赢。本文首先对搜索广告及其相关特性进行了研究,然后针对搜索广告的独特性,对搜索广告系统功能性需求与非功能性需求进行了深入的分析,并结合在线广告系统的关键技术,对系统的整体架构以及各模块的功能进行了描述,最终设计并实现面向搜索引擎的在线广告系统。此广告系统包含查询处理、广告检索、广告排序与广告管理四个模块。广告主可以在广告管理模块中对创建并管理广告计划、上传广告素材、查看广告投放数据统计等功能。系统在收到用户搜索请求后,会对查询进行标准化和改写处理。广告检索模块会根据扩展后的关键词集合进行匹配,得到广告候选集。广告排序模块根据每千次展示点击率来进行排序,将排名靠前的广告返回给搜索引擎。本文针对搜索广告检索中语义匹配的问题,对比了三种语义匹配模型效果并选择了基于卷积语义匹配模型用于本在线广告系统。该模型先分别将查询词和广告标题利用word2vec算法进行向量化,得到查询和广告标题的向量化表示,针对广告标题用卷积神经网络把标题表达为低维语义向量,利用深度神经网络将查询表达为低维语义向量并通过余弦距离来计算两个语义向量的距离,用点击数据做有监督训练,最终训练出语义相似度模型。该模型既可以用来预测两个句子的语义相似度,又可以获得某句子的低纬语义向量表达。
其他文献
采矿方案优选决定企业决策成败与经济效益好坏,在采矿方案优选的多目标数学决策中,保证指标权重获取的合理性与最优性,是优选体系构建的关键。为解决指标权重获取的合理性问
溜井作为简化矿山提升运输的系统,具有生产效率高,成本低的特点,在金属矿山地下开采中应用极为广泛,是多阶段运输矿山实现矿(废)石高效低成本下向运输,确保矿山安全高效生产
互联网上每天都会产生大量的数据,用户希望能够从大量数据中快速获取所需内容。现有的检索信息的方式已经不能够完全满足用户的检索需求。用户希望能够直接检索到自己真实需
纸质文献记载了人类历史长河中的优秀文化,对人类文化信息的传播和交流有着重大意义。但由于造纸工艺、储存环境等内外因素使得纸张酸化,导致纸质文献变得脆化易碎,失去使用
室温磷光(RTP)材料可以在外源激发光照射下储存部分能量,关闭外源激发光后,能以可见光的形式释放出来,使其在高级防伪、生物成像、化学传感等领域具有潜在的发展前景。但传统的
随着社会的发展与进步,人们对生活水平的要求,无论是精神上还是物质上都提出了更高的要求。装饰材料作为室内装修的重要用料,对美化环境提升人们幸福指数具有重要的作用。利
生物网络中的关联关系研究有助于寻找致病因子和潜在的药物靶点,对人类疾病的诊断、治疗和预防具有重要的价值。生物网络中的关联预测是生物医学领域的研究重点之一。生物网
生长素和脱落酸是两种非常重要的植物激素,它们之间既相互独立又协调地调控植物种子萌发、营养生长、种子成熟和休眠等生长发育与环境胁迫的各个过程。当植物体内生长素增多时,AUX/IAAs被生长素受体SCFTIR1/AFBs泛素化,随后被26S蛋白酶体降解,从而释放ARFs,并进一步调控下游生长素相关基因的表达。脱落酸的主要功能是抑制生长和调节植物对胁迫的响应。当植物体内ABA水平升高后,PP2Cs的磷酸
SUS304由于其优异的性能(外观装饰美、机械强度高、化学性能好等)被广泛应用于装饰、建材、加工、储存和运输等领域。然而它的“不锈”是相对的,使用时会发生多种腐蚀,既造成
造成内部资产破坏和窃取的内部攻击是由内部员工发起的,常见的内部攻击防御方式是身份认证技术,该技术无法对内部使用者的合法性进行持续有效的认证,因此以生物特征为基础的持续认证方法逐渐成了研究热点且有效弥补了传统身份认证技术的缺陷。但是当计算机的真实用户进行恶意操作时上述的认证技术就会失去防御作用。为了避免资源文件遭到破坏或窃取,有研究人员提出针对文件系统访问行为进行研究,然而仅从文件系统的角度进行防御