面向深度搜索的数据汇聚与整合

来源 :浙江大学 | 被引量 : 0次 | 上传用户:cyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社交网络和移动互联网的兴起,数据正在以前所未有的速度被创造出来,大数据受到了越来越多的关注。海量的数据中蕴含着大量有价值的信息,但是要从中找到用户所需要的信息是一件很困难的事情。搜索引擎在很大程度上可以解决这个问题。然而,搜索引擎只是根据用户提交的查询在海量的数据中进行相似度匹配,将查询结果返回给用户,由用户来选择,而并不是对用户提交的查询给出明确的答案。  深度搜索技术是知识计算与搜索引擎的结合,通过对海量数据进行潜在语义分析、主题挖掘等处理和对用户的查询意图进行深度的分析和理解,为用户提供精确的答案。深度搜索的第一步就是要从海量信息中收集数据并加以整合,本文所要研究的内容就是面向深度搜索技术的海量数据汇聚与整合。主要的任务是从多数据源获取和存储数据,并对多信息源的返回结果加以分析和融合。  本文的主要工作如下:  第一,介绍了数据汇聚与整合系统的总体设计,按照系统的功能需求,给出了系统相关的模块设计。  第二,针对系统的需求,提出了基于主题相似性的搜索调度算法和基于位置排名的排序算法来解决信息源的调度问题和多信息源结果融合问题。  第三,介绍了系统具体实现时所需要的关键技术,并对系统做了相关的测试。
其他文献
零等待流水车间广泛的存在与现代制造系统中,如钢铁、医药等制造系统。在零等待流水车间中,假设有n个工件被m台机器加工。各个工件由z个工序组成,每个工序与机器是一一对应的,即一种机器只能加工一种工序,一个工序只能在一台机器上进行加工。一个工件的连续两道加工工序不能出现中断。一台机器不能同时加工多个工件。因此零等待流水车间调度算是一个典型的NP-hard问题。已有的调度策略和传统的调度方法已无法满足实际
目前伴随着3G通信、无线网络等技术的飞速发展,车载多媒体系统在广告、娱乐等方面应用日益广泛。车载终端设备作为车载多媒体技术的载体与3G无线网络通信甚至与互联网的结合
论文设计并实现了一种应用于变电站环境下,解决变电站无人值守化的移动巡检机器人控制系统。在本论文中主要讨论了移动机器人的设计建模、控制、算法以及部分相关的硬件设计策
随着语义网的不断发展以及开放链接运动深入展开,发布在互联网上的RDF数据不仅已达到百亿级三元组规模,而且呈现出几何增长的趋势。有效的管理和查询这些RDF数据,正显得日益重要
学位
时代的不断进步,国家经济的不断向前发展,使工业、国民用电量日益增加。热电站在蒙古国人民生活中起着不可替代的作用。而为了保证热电站安全、长期稳定地运行,监控系统的布置迫
可逆数据隐藏技术不仅能达到安全传输秘密信息的目的,而且还能无失真地恢复原始载体图像,因此得到广泛的应用,尤其在大型的企业、军事等对原始载体图像要求比较高的机构占据
无线传感器网络(Wireless Sensor Networks,WSNs)的快速发展得益于微电子技术、无线网络技术及传感技术等先进技术的不断进步。无线传感器网络由部署在监测区域内大量的传感器节
梯形图(LD)拥有直观形象、简单易用、易于掌握等特点,是可编程控制器(PLC,Programable Logic Controller)上控制算法实现的主要方式。它在控制器上的执行采用“从上到下,从左至
随着开放网络环境的发展,由物理社区环境逐渐演化出开放、共享、多元化的在线社区环境。在实体进行协作活动前,为其提供安全性保障成为在线社区当前面临的挑战之一。信任管理的