异构数据库集成中相同语义对象识别方法研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:yangweifeng111222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几十年来,科学技术的迅猛发展和信息化的推进,使得人类社会所积累的数据量大大增加,数据的采集、存储、处理和传播的数量也与日俱增。实现数据共享,可以使更多的人更充分地使用已有数据资源,减少资料收集、数据采集等重复劳动和相应费用。但是,在实施数据共享的过程当中,由于不同用户提供的数据可能来自不同的途径,其数据内容、数据格式和数据质量千差万别,有时甚至会遇到数据格式不能转换或数据转换格式后丢失信息等棘手问题,严重阻碍了数据在各部门和各软件系统中的流动与共享。因此,如何对数据进行有效的集成管理已成为增强企业商业竞争力的必然选择。 随着全球网络化、信息化的发展,网络上的信息越来越多,对信息检索手段的有效性要求也越来越高。互联网的缺陷日益显露出来,如:搜索引擎只能基于关键字搜索,智能程度低,搜索出来的结果往往不是用户真正需要的等等。互联网的创始人Tim Berners-Lee在2000年提出了语义Web的概念和体系结构。 数据的语义是判断数据相关性的根本依据。而只有得到了数据的相关性,互操作才可能成为现实,所以对于异构数据库的集成来说,要解决互操作能力方面存在的不足,其根本措施之一就是对各种数据库中的数据进行语义描述,从而为数据建立语义环境,为自动化数据处理、逻辑推理和重用提供基础。 异构数据库语义集成的主要任务是解决数据库间语义相关对象的识别问题,其核心就是在数据库间找出语义相关的属性,即属性匹配问题。问题的解决对于实现数据库的互操作及信息的综合利用有着非常重要的意义。 本篇论文首先分析了现有异构数据库语义集成技术;具体到语义匹配,首先提出基于权值的异构数据库语义集成中属性匹配方法,然后考虑到基于规则匹配方法需要先验知识来确定描述属性的各数据指标的权重,提出了不直接人为地给属性的元数据赋予权重,而是尝试应用机器学习及人工智能的方法从描述属性的各数据指标中学习规则。在处理具有不确定性的属性匹配问题上,神经网络有着独特的优势,神经网络是通过具体的实例进行训练而不是根据确定的规则进行编程,不需要先验知识,能够充分考虑到属性实例值的信息,且有较强的推广能力和自适应能力。 本论文主要研究工作如下: (1) 综述现有异构数据库语义集成技术,分析了目前文献中应用最多的三种判定属性相似度方法的不足,提出了一种改进的基于权值的异构数据库语义集成中属性匹配方法—CRC法。该方法首先根据数据类型把属性进行分类,然后根据重要性对特征向量进行排序,按照给定的公式计算权重,最后进行属性匹配。 (2) 基于权值的方法属于基于规则匹配的方法,此类方法需要先验知识来确定描述属性的各数据指标的权重,属性的各数据指标的权重很难准确量化。即便是在一个应用环境下给出了合理的权重,当环境变化时仍要重新修改权重,动态适应能力较差,也不能找到一个通用的固定匹配规则来实现属性的匹配。根据其不足,结合进行语义匹配的特点以及神经网络的优势,提出用SOM神经网络模型对属性进行分类的思想。
其他文献
期刊
三元层状可加工陶瓷(MAX相)结合了陶瓷和金属的优点,具有低密度,高的模量、强度、热导与电导,良好的抗损伤容限、抗热震性以及化学稳定性等特性。典型的MAX相,如Ti3AlC2、Ti2AlC和C
随着互联网技术的飞速发展,许多新媒体形式应运而生,内容也不断丰富,给各级电视台文字编辑工作带来了压力和挑战,也给电视台文字编辑工作人员提出了更加严格的要求,需要进一
利用自蔓延高温合成(SHS)方法制备高性能的多孔陶瓷材料是近年来国内外研究的一个热点.该文采用该方法制备了氮化硅基多孔陶瓷,并研究了其中的工艺和理论问题.首先,以商用硅
AlN热导率高(理论值320Wm-1K-1)、介电常数小、且与硅的热膨胀系数相匹配,近年来用于制备导热复合材料以提升电子元器件封装散热能力,成为电子封装领域的研究热点。添加高含量A
为了消除传统三酸(磷酸-硫酸-硝酸)抛光对环境污染和人们身体的损害,确定开发以磷酸-硫酸为基液的无烟化学抛光技术,该技术的关键是在基液中添加一些具有特殊作用的化合物来替代硝
部编初中语文教材构建了“教读—自读—课外阅读”三位一体的阅读课程结构[1].自读课是教师引导学生借助“旁批”“阅读提示”等助读系统,凸显学生主体地位,指导学生学用阅读
本实验研究了Tb离子掺杂锗酸盐玻璃和以ZnO为发光中心的硅酸盐闪烁玻璃的光学性质.测试项目包括透射光谱,吸收光谱,紫外和X射线激发发射光谱,荧光衰减动力学曲线等,并进行了
机器视觉是应用计算机来模拟目标外显或宏观视觉功能的科学和技术。论文以番茄幼苗为研究对象,利用机器视觉技术进行其形态特征的无损检测研究,为实现其生长过程中的实时监测和
在施肥播种开沟作业中减少土壤扰动、避免干湿土混杂,可以有效减少土壤水分无效蒸发,保证种子萌发。开沟器是播种施肥机械的关键工作部件,在中高速作业条件下其结构设计对土