基于Web的异构数据集成方法研究

来源 :武汉理工大学 | 被引量 : 4次 | 上传用户:wangxinyi808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,Web上的数据日趋成为当今数据的主流,但是分布在Web上的数据多是异构的,并不是真正意义上统一的可直接利用的信息资源,为了实现信息共享,必须有一种系统能够支持异构数据集成。异构数据集成的任务就是通过给用户提供一个统一的应用平台,从而屏蔽底层数据源的不同,使得用户可以无缝而且灵活的访问这些异构数据源。Web数据具有范围广、数量大、形式复杂、变化迅速等特点,传统的数据集成技术已渐渐不能满足Web异构数据集成的要求,近几年兴起的Web Service技术是一种新的分布式计算技术,建立在XML技术基础上,XML本身具有的与平台无关、易于扩展、交互性好等特性,能够为Web异构数据的集成提供强有力的支持。本文首先分析和研究了数据集成中的技术,包括Web Service技术中的WebService架构模型、协议规范、特征和优势以及XML技术中的XML相关工具、标准体系、模式、查询语言和解析器,重点深入研究了XML查询语言和XML解析器。本文下一步对异构数据集成技术进行了深入地研究,包括异构数据集成的定义、所面临的问题以及异构数据集成的方法,重点对数据仓库法、联邦数据库法和虚拟视图法三种常见的数据集成方法进行了深入地分析和对比,选择虚拟视图法作为本文架构的基础。随后,基于数据集成中的虚拟视图法本文提出了基于Web的异构数据集成设计方案,详细全面地介绍了构成数据集成框架的三个层次,包括用户应用层、中介层和数据源层,重点研究了用户应用层中的Web Service的发布和查找技术、中介层中的XML查询分解算法、数据库中数据向XML转换的技术以及XML解析技术。最后,在总结全文的基础上,结合其它与集成系统相关技术的发展趋势,提出了若干有待进一步深入研究和分析的问题。
其他文献
支持向量机(Support Vector Machine)是数据挖掘的新方法,也是一种小样本统计工具,它在解决小样本、非线性及高维的模式识别问题上具有其他机器学习方法难以企及的优势。在支
实体间语义关系抽取是信息抽取中的重要环节。目前,在中文语义关系抽取中基于特征向量的机器学习方法占重要地位,它的研究重点在于如何获取各种有效的词法、语法和实体等特征
基于关键词的信息检索系统首先把原始的文本信息中的关键词建立倒排索引。当用户输入查询关键词后,检索系统把用户输入的关键词从倒排索引库中查询,返回包含关键词的文档。基
无线传感器网络是一种新兴的网络,融合了很多新的技术,因此,具有很强的通信能力,在各个领域都得到了广泛的应用。在无线传感器网络中,一个重要的技术是无线传感器节点定位,因
学位
果蝇优化算法(Fruit Fly Optimization Algorithm,FOA)是一类新的全局优化群智能算法。该算法源于对果蝇觅食行为的模拟,算法优点明显,如原理简单、调节参数较少、代码容易实
在安全事件中,恶意代码造成的经济损失占有最大的比例。恶意代码的检测技术总是滞后于新恶意代码的出现。一方面是人们很难区别正常代码和恶意代码;另一方面,很多信息系统缺少必
搜索引擎是互联网用户最常用的信息查询工具。目前主流的搜索引擎并没有明确区分不同用户的查询意图,而不同用户即使输入相同的查询词,其查询需求也是有差别的。个性化信息检
随着现代科学技术的发展和工业的发展,人们对钢的质量(如钢的纯净度)、使用性能、炼钢生产率及成本等方面,都提出了越来越高的要求。电弧炉炼钢已经不能满足要求了,因此精炼炉底吹
随着越来越重视软件测试在软件工程中的重要作用,人们对软件测试的投入也随之增多,自动化软件测试替代手工测试将是软件测试的主流趋势。网络技术的迅速发展使得分布式应用软