论文部分内容阅读
随着“数字地球”概念的深入人心,人们越来越深刻地意识到信息共享在其中发挥的重要作用。就地学领域而言,一方面,人们纷纷在为实现地质信息的数字化努力,建立了大量的地质数据库系统;另一方面,又为这些数据库系统所遇到的数据难以共享问题所困扰,导致了数据资源的浪费和重复建库现象,浪费了大量的人力、物力。为此,关于实现数据共享的研究全面展开——建立行业标准成为人们认可的普遍方法。
中国的全面标准化工作开始于19世纪80年代中叶。近20年来,我国已研究和制定了若干有关地理信息的国家标准和行业标准,包括基础标准、方法标准和产品标准。这些标准在国土资源信息数据库的建设中起到了重要的统一作用,主要体现在每个采用分布式进行数据采集建立起来的全国性数据库能够遵循统一的标准。但是,这些标准的制定工作基本上仅围绕着具体数据库或项目所涉及的内容进行,很少顾及与同一体系内的其它相关标准的关系。另一方面,由于各部门各单位的数据库采用各自的模型,而且各模型中对相同含义的数据项采用的是自定义的、互不相同的字段代码,标准之间各自独立,导致多个同类数据库遵循不同标准的现象随处可见,给数据的集成与综合造成很大困难。这样就严重影响了系统间宝贵的地学数据的重用与共享。要保证地学信息系统为矿产资源规划、管理、决策等多部门提供有效的服务,就必须对系统实行标准化管理。
如何有效的集成每个单主题式数据库,从而成为一个多主题协调的数据库,为矿产资源规划、管理、决策等多部门提供有效的服务成为当前急待解决的关键问题。这就必须对系统实行标准化管理,即在系统开发和建设过程中,要求系统内部的各个技术环节执行和采用相关的各级标准和规范,特别是在数据库设计过程中对数据模型采用标准化设计,采用统一的信息分类代码、统一的数据质量要求和统一的数据描述等,使得地学信息系统或地学数据库的设计、开发和应用工作有一个共同的依据和约束;建成后的数据库采用标准化数据录入。最终实现各个单主题数据库的无缝集成使各个单主题数据库间的数据能够畅通访问与交换。
本文从地质数据库的设计角度,对数据模型的标准化方法进行了研究和探讨,并在此基础上提出了实现数据标准化描述的解决方案,旨在解决地学数据库因数据模型各异及多种标准相互独立导致的数据共享难问题。
本次研究以数据字典技术为主要技术路线,并形成了一套标准模型数据字典体系。在分析多种DBMS系统数据模型基础上,总结并制定了一套适合地学数据库特征的标准数据模型;利用建立的标准模型字典和标准数据项字典,实现数据库模型结构的统一。通过引入《GB9649-88地质矿产术语分类代码》辅助系统设计,保证了地学数据库中术语的规范化,从而实现了异构数据库系统数据模型的标准化。为了保证具有标准数据模型的数据库系统能够实现正确的、规范的数据录入,本文提供了数据标准化描述的解决方案。在地质数据库中,使用代码数据既可以提高数据检索效率、增强数据的共享性,又便于用户的输入操作。为了保证数据库中代码数据的规范性,研究和制定了术语代码编制规则,并建立存储国标、用户提示代码的数据字典,用来实现标准数据模型的设计及代码数据的规范输入。数据描述的标准化的另一个方面是通过对数据项值域的限定,约束数据的输入。不同的DBMS系统都提供了对数据项值域的设计,但这些方法都直接作用于数据库,程序完全依赖数据库结构。为此,将系统数据的值域约束存入数据字典,通过数据字典这个“接口”约束输入数据,达到程序与数据库的分离,最终实现数据描述的标准化。
本研究运用数据字典技术,并结合异构数据库转换技术,采用VB语言开发了异构数据模型标准化系统,实现了数据模型的标准化设计,该系统同时支持不同DBMS系统的数据库转换功能。
论文主体部分分为五部分。首先,介绍了地质数据库设计的一般步骤。第二部分研究了数据模型标准化的方法:通过引入((GB9649-88地质矿产术语分类代码》,实现数据模型标准化的辅助设计:建立标准模型数据字典体系,完成模型标准化系统的设计和开发:通过对数据库设计过程中主要环节的标准化设计,最终实现地质数据库数据模型的标准化;最后以钻孔岩芯编录为例,展示了经过模型标准化设计后的数据成果。第三部分,数据描述标准化:从地质定量化角度研究了地质定性数据的定量化实现——制定属性编码规则,并通过建立代码字典作为系统设计与编程的标准;通过对数据项值域的标准化设计,实现了数据库数据的标准输入。第四部分,研究和总结了本次研究所用到的关键技术,如数据字典技术、异构数据转换中的中间件技术等。最后,在介绍数据模型标准化系统设计方法的基础上,介绍了该系统功能模块的应用及实现方法。
创新点:本文依据标准数据模型思想,研究了地质数据库数据模型标准化的基本方法:并采用VB语言设计开发了具有异构数据库转换功能的数据模型标准化系统,实现了异构数据模型向标准数据模型的转换。