搜索策略评估模型的研究与实现

来源 :东南大学 | 被引量 : 1次 | 上传用户:mddh9666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎运营工作的目的之一是对搜索引擎进行优化,随着数据量的积累和相关技术的完善,提出了运营工作从人工决策到数据驱动的转变。作为运营工作中重要的反馈机制,搜索策略的评估也需要进行转变,从而符合新的发展要求。在互联网数据爆炸式增长,互联网产品迭代快周期短以及低质作弊站点增多的背景下,如何提供人力成本低、时间效率高、评估结论准确、包含站点权威性度量的搜索策略评估模型显得尤为重要。本文通过研究搜索引擎相关性计算模型和权威性计算模型的相关特点,结合A/B在线实验框架,提出了用于搜索策略评估的模型,并设计实现了原型系统,论文的主要工作有:(1)针对相关性评估中现有评估方法标注数据获取难,时间成本大,评估结论不准确的问题。基于点击模型进行改进,通过提出假设,建模用户点击浏览行为,设计了适用于A/B实验的相关性评估算法RelevanceMetric。(2)针对基于内容的权威性计算模型时间复杂度高,站点权威性评价依赖人工判断的问题。提出适用于A/B实验的权威性评估算法AuthoritylMetric。它从站点链接关系入手,对TrustRank算法进行改进,即突出了权威性的主题相关特性又缩小运行范围。通过中文分词和重要性计算,在保证用户主需求的前提下,缩短文本匹配时间。(3)进行了相关实验,通过准确率,召回率,F1值,MRR等作为实验指标,验证了评估算法在精确性、稳定性以及时间效率上都有较好的表现。(4)基于分层架构的思想和Hadoop,MySql技术,进行了原型系统的设计与实现。
其他文献
点击化学反应是一类通过拼接小单元结构分子,进而快速、可靠地合成各种各样大分子的反应。点击化学反应因具有原料易得、操作简单、反应条件温和、抗干扰性强、产率高等优点,
赤霉素(Gibberellic acid,GA)是一类非常重要的植物激素,其在调节植物生长和发育方面发挥着关键性的作用。目前已知的GA信号调节因子主要分为两类:一类是GRAS蛋白家族,另一类
随着人们物质生活水平的提高,随时随地的高质量通信成为人们日常生活中的必需品,高速、稳定、安全的无线通信需求迫在眉睫,这对当前无线通信技术来说既是巨大的挑战也是难得
多地震属性综合分析技术在地质勘探中有着重要的作用。通常多地震属性综合分析计算具有计算复杂度高、计算量大的特点。使用单机进行计算,计算速度受到限制,需要消耗大量的计
卷积神经网络(Convolutional Neural Networks,CNNs)在目标检测领域表现卓越。然而由于其参数规模过大,深度卷积神经网络中往往存在大量冗余。本文选取了现今最优的实时检测网
文本表示在文本分类、信息检索等自然语言处理应用中具有基础性的重要作用,尤其在当前网络文本规模指数增长的时代,获得有效的低维度文本表示成为许多应用技术可实用的关键。
近年来,世界工业化水平越来越高,对能源的消耗也日益增加,同时,伴随技术的革新,通信及互联网行业的迅猛发展,服务器和运营商机房基站的数量激增,伴随着数据量、计算量的增长,
近年来,随着用户对无线网络应用的需求不断增长,有限的可用频谱资源变得越来越紧张,然而已使用的频谱其利用率却不高。认知无线电技术应运而生,它可以感知周围无线环境中的空
随着工业信息化时代的到来,机器视觉在各个领域的应用越来越广泛,图像复原技术是其中一个重要分支。生产生活中对图像复原技术的应用需求正在不断扩大。数码相机在捕获图像的
随着时代的发展,普通的2D视频已经越来越不能满足人们生活娱乐需求。对视频3D(3 Division,3D)效果的追求俨然已为当今视频发展的一个热门方向,3D游戏的普及就是一个典型的代