半结构化数据集成技术研究

来源 :大庆石油学院 东北石油大学 | 被引量 : 0次 | 上传用户:scotscotscotscot
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年由于因特网和电子商务的发展,企业内部基于WEB和办公系统的信息量增长迅速,这些数据具有不确定的子类型和属性,包含复杂数据类型和复杂的引用关系,如WEB上的网页、各种文档等,我们称这些数据为半结构化数据。如何将这些半结构化数据同传统的结构化数据集成在一起,是当今一个重要的研究课题。其中,解决半结构化数据模型和结构化数据模型的集成,实现这两类数据的相互转换,是解决问题的关键。针对此领域目前存在的不足,本文提出了一种基于XML的半结构化数据集成技术:即利用XML作为中间件来对半结构化数据进行集成。将半结构化数据集成分为相对独立且相互关联的两个部分:即半结构化数据模型的建立、半结构化数据模型与结构化数据模型之间的双向映射。其中半结构化数据模型的建立负责将半结构化数据进行规范化、抽取数据模式;半结构化数据模型与结构化数据模型间的双向映射负责通过映射算法将抽取而得的半结构化数据模型与结构化数据模型实现互转化,进而达到半结构化数据集成的目的。论文首先分析了半结构化数据的数据结构和XML的相关技术、基本内容和特点,提出一种将半结构化数据规范化的方法。阐述了XML与关系数据库的关系、建立XML数据与关系数据库间的转换机制。最后通过定义了RTD、MM和MT三个数据模型,结合实际项目对如何应用这些理论进行了阐述。随着信息化的逐步推进和信息量的飞速膨胀,数据集成的范畴会越来越广,对各种数据进行集成的要求也会越来越迫切。论文的开题来源于大庆石油管理局实际的项目,因此具有重要的理论和实际价值。
其他文献
本论文针对国内外电子商务网站的商业运营与推广效果评估需要,研究能够持续提升网站经营利润的访客行为分析系统的结构与构建过程。通过使用该系统,电子商务网站的经营分析决策
嵌入式系统的广泛应用需要良好的软件系统支撑。随着嵌入式系统的深入发展,系统的动态可扩展能力已经成为一个基本的需求,迫切需要一种机制能在运行状态下配置系统,也就是系
随着计算机技术、网络技术的快速发展,电商网站、社交门户以及医疗、教育、公共平台等领域的智能化应用等信息时代产物已深入人们的日常生活,影响了人们的行为习惯和思维方式
随着嵌入式系统硬件性能的提高和相关软件技术的发展,嵌入式POS的使用越来越广泛,更多的企业和组织已加入到POS应用和服务的领域中。在POS应用的基础平台方面,SUN公司提供了针对消费电子和嵌入式设备制定的J2ME(Java 2 Micro Edition)版本,为POS设备应用的开发提供了完善的运行环境。本课题的合作单位实现了一个基于J2ME的POS开发平台,本论文的研究内容就是基于此POS开发平
Ad Hoc网络是由一组带有无线收发装置的移动终端组成的一个多跳的临时性的自治系统。Ad Hoc网络中的移动终端具有路由和报文转发功能,可以通过无线连接构成任意的网络拓扑。这
随着城市的发展,人口的增多,视频监控系统被广泛应用。而传统的视频监控,主要是通过人工来完成检测,这种方式通常容易让人产生疲劳,进而造成漏报或误报现象的发生,最终导致社
程序切片是一种分析和理解程序的技术,通过分析程序语句之间的依赖性关系自动分解源程序。程序切片技术被广泛应用于程序理解、调试、维护、测试以及反向工程等。随着Web技术
Kerberos协议是当前应用最广的身份认证协议,但是它也存在固有的安全缺陷。本文在对Kerberos协议认证原理进行详细分析的基础上,采用公钥密码体制对其进行了改进,在不改变其
随着PDA的广泛使用,传统的C/S计算模式已经显露出明显的不足,移动agent以其对环境的适应性和自主迁移性,使得低内存、弱连接的移动设备在分布式计算中的应用成为可能。除移动agen
数据挖掘中面临大量的不完备信息系统,即可能存在部分对象的一些属性值未知的情况。不完备的数据可能使挖掘过程陷入混乱,导致不可靠的输出。其所表现出来的不确定性也更加显