面向精准问答的数据处理的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:anqiiqna
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的迅速发展,使得互联网上的信息越来越多,人们越来越不能从海量的信息中获取对自己有用的信息。当用户使用搜索引擎进行搜索时,给出的结果往往是非常多的,用户还需要去自己甄别,这就使得简单的排列搜索结果并不能满足用户的需求。精准问答的出现可以为用户的搜索提供准确的答案,省去了用户自己去甄别的过程,为用户提供更好的搜索体验。精准问答中最重要的就是展现给用户的答案数据,对数据的准确性和实效性有很高的要求。所以提供的答案需要准确的数据来做支撑,这就需要建立一个非常完善的数据处理流程来获取精准问答答案数据。本文首先论述对精准问答数据处理的研究背景和意义,根据调研结果得出本文的研究内容。接下来根据研究内容对整个精准问答数据处理中涉及到的关键技术和原理进行了详细阐述,包括Web信息抽取技术、XML技术、流式计算平台、搜索引擎建立索引等。然后对精准问答数据处理进行了总体需求分析,并针对本文设计与实现的Web信息抽取、文档拆分、乐队成员生成三个部分做出了功能需求分析。接着对数据处理进行总体设计,给出了 Web信息抽取模块、文档拆分模块、乐队成员生成模块的概要设计和各模块详细设计与实现细节。最后说明了测试环境,分别对三个模块进行功能测试和性能测试,并对测试结果进行总结。
其他文献
自古以来,中国都是注重农业生产的农业大国,而植物病虫害问题,一直是困扰农业高效生产的主要问题之一。随着精准农业的提出,为了实现高产出,除了科学播种,高效防护之外,快速而准确的植物病虫害识别方法成为迫切的需求。与此同时,随着计算机硬件的升级换代,运算性能也日趋强大,为构建电脑端的自动识别系统提供了可能性。此外,随着移动设备的普及和发展,高清摄像头和高性能处理器等综合因素为基于自动图像识别的疾病诊断提
自本世纪开始,人们的生活日新月异,在现代科学技术发展一日千里的背景下,网络正在改变人类的生存方式。移动互联网时代,媒介形式不断更迭,万物皆媒,万物皆可联,众多新兴媒介对人们原有的生活方式和消费习惯产生巨大冲击。全球化趋势下,以“短、潮、趣”为切入点的短视频行业受到大众广泛的喜爱,“抖音”更是一跃成长为行业的领头羊,不仅用户规模庞大,而且组织结构和管理规范较为完善,引来其他短视频App的效仿。传播技
单元测试对保证软件质量和提高软件可靠性具有重要作用。传统的约束求解技术为被测函数自动生成测试用例时,变量取值范围往往采用连续型区间表示。但当变量参与位运算操作时,
2017年1月1日,国内盐行业迎来市场化改革,打破了2600多年的垄断经营。面对充分竞争的市场环境,盐业公司如何调整自身战略定位,制定战略转型规划显得尤为重要,而如何做好投融
随着环境的日益恶化,港口企业的粉尘污染问题以及在粉尘治理过程中造成的资源浪费等问题越来越受到人们的重视。我国煤炭以及港口企业在粉尘环境污染治理方面虽然采用防风网
本文介绍了永磁制动器的发展,分析了普通永磁制动器存在的缺陷,并针对航空环境提出了一种新型永磁制动器方案。完成了制动器的结构设计和关键材料选用,并进行了三维磁场仿真,
猪轮状病毒(Porcine rotavirus,PRV)是导致仔猪发生病毒性腹泻的主要病原之一。仔猪轮状病毒腹泻危害我国养猪业,每年造成的经济损失巨大。现行疫苗在控制本病的发生与传播上效
随着工业进程的发展和人口数量的持续增长,环境污染和能源短缺问题越发突出。为了减缓发展带来的能源与环境问题,科研工作者们投身于寻找可替代的绿色能源以及降低环境污染的解决办法。光催化技术被认为是解决这些问题的有效途径之一。为了充分利用丰富的太阳能,迫切需要开发一种可以吸收可见光区的太阳光、具有高效的催化活性的半导体催化剂。本论文以光催化剂BiOX为研究对象,针对其在光吸收、界面氧化还原反应以及光化学稳
自2010年电影《阿凡达》上映以来,三维显示技术越来越被人们所熟知和欢迎。然而就目前技术来说,直接拍摄立体电影制作复杂、周期长、成本高,其立体电影的数量远远无法满足人
青岛地区主要为花岗岩地质,岩质坚硬,为隧道建设提供了良好的先天条件。但8号线地铁沿线部分地区岩石风化、破裂较为严重,是典型的残丘剥蚀斜坡地貌,在工程安全性评价时困难重重,所以急需我们寻找一种更加有效的围岩安全性评价指标,以便为地下工程施工、支护提供更安全、合理的方法。考虑依据安全系数法,结合D-P屈服准则,利用ABAQUS模拟软件,模拟隧道断面安全系数与位移变化,并结合实际工程问题分析安全系数小于