科学数据库中单点数据库资源统一访问技术研究与实现

来源 :中国科学院计算机网络信息中心 | 被引量 : 0次 | 上传用户:masdfsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学数据库及其应用系统(简称"科学数据库")是中科院"十五"信息化建设的重大项目,该文讨论的内容就是以此项目为背景的.科学数据库经过二十年的资源积累,现存的海量数据资源急待开发利用.由于历史原因,这些数据分布存储在各种数据库和文件系统中.如何充分利用这些数据资源成了科学数据库的一个重要课题.该文尝试从研究单点数据库资源出发,寻求一种对数据库元数据的统一表示方法,然后设计一个单点数据库资源的统一访问系统.首先,我们制定了一种数据库元数据标准,根据这个标准从原始数据库元数据中提取需要的内容,称为本地元数据.然后,从全局访问的角度,将本地元数据中的结构信息屏蔽掉,用全局虚拟字段来替代原物理表和物理字段,同时也消除了原表中的约束信息(如主键、外键).每个虚拟字段对应于数据库中多个表中的同名物理字段,这样,将每个数据库的元数据可看作一张只包含虚拟字段的数据表,我们称之为"全局元数据表"或Global Schema,其中,它还保留了部分映射信息.这个全局元数据表在数据资源的统一查询中有非常重要的作用.在全局元数据基础上,此系统自定义了一种全局数据库查询语言"SDG_QL",它的最终设计目标是多点数据库资源的跨库查询,但目前仅支持单点数据库的查询,还有待进一步扩充和改进.为了封装底层数据库的异构性,我们采用了网格中间件技术,利用网格服务对单个的数据库资源进行封装,对外提供统一的访问服务.这样,用户可以通过网格服务查询全局元数据信息,编写SDG_QL查询语句,提交给查询服务,由查询服务获得数据结果返回给用户.网格服务通过全局元数据和本地元数据的映射关系,将SDG_QL语句翻译成标准的SQL语句提交给数据库执行,最后将结果以XML格式返回给用户.作者在此系统中的主要工作是定义了一种本地元数据Schema,并根据同名匹配的算法将其转换为全局元数据,最后用网格服务的方式封装了获取数据库全局元数据的功能.这些构成了统一访问的重要基础功能模块.此系统的名称叫"Cactus",目前完成了初步的原型设计,并实现了大部分的功能,基本验证了设计思想的正确性,为今后研究分布式异构数据库的多点跨库查询打下了坚实的基础.
其他文献
该文工作的主要背景是中国科学院"十五"信息化建设重大项目——"科学数据库及其应用系统".科学数据库经过近20年的发展,已经建成了上百个不同数据类型、不同学科的专业子库,
该文针对应用领域中空间数据的不确定性,重点研究了不正确空间区域间的拓扑关系分析和模糊区域建模问题,在分析已有研究工作的基础上,提出了几种拓扑关系的形式化模型,能够更
学位
随着计算机网络的高速发展,电子邮件的应用越来越多,但是垃圾邮件也随之越来越猖獗.目前,针对不同的网络环境,出现了各种各样的邮件过滤模型,但是大多数并不能解决垃圾邮件对
由于近年来电信增值业务发展迅速,原有的业务接入方式已无法满足目前的需求,所以综合业务接入网关随之出现。目前电信运营商正在各地积极部署综合业务接入网关,但与其配套的
在高性能超标量处理器中,通过不断的提高并行取指和并行执行来提高处理器的性能已经变得相当复杂,而且程序的控制和数据相关性也使得处理器带宽提高受到很大的阻碍.踪迹处理
近年来,Internet正以令人难以置信的速度在飞速发展,越来越多的机构、团体和个人在Internet上发布信息、查找信息。虽然Internet上有海量的数据,但由于Web是无结构的、动态的,并
教育资源库是一个庞大的系统,包括大量的媒体素材库、课件库、题库、案例库、附件库等等,其多媒体教育资源种类繁多、形式各异.要有效的进行检索,除了要定义良好的资源库的逻
软件工程发展几十年,各种理论与技术不断涌现,但是各种异构系统之间的集成、规约,即实现软件系统互操作性(interoperability),以便达到领域复用的目的仍是软件面临的重大问题
中国的证券市场成立十几年以来,随着信息化的发展,金融机构积累了大量的原始数据.激增的数据背后隐藏着许多重要的信息,人们可以对其进行更高层次的分析,以便于更好的利用这