XML文档匹配研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户：laowangtou2

【摘要】

：

随着信息技术的发展,人们对于XML数据的转换、集成和共享的需求越来越多,异构XML文档的匹配研究成为新的研究热点。虽现已存在一些相对成熟的针对结构化数据(如数据库数据)的

【作者】

：

王大刚

【机构】

：

安徽大学

【出处】

：

安徽大学

【发表日期】

：

2008年期

【关键词】

：

XML数据转换半结构化数据文档匹配特征向量上下文匹配

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息技术的发展,人们对于XML数据的转换、集成和共享的需求越来越多,异构XML文档的匹配研究成为新的研究热点。虽现已存在一些相对成熟的针对结构化数据(如数据库数据)的匹配方法,异构XML文档标签的匹配方法可以借鉴这些方法中的思想,但同时还需要结合半结构化数据自身的特点,探寻更适合于半结构化数据自身特点的匹配算法。　　本文详细地阐述了现有模式匹配方法的分类、特征和适用范围。并在针对已有的异构XML文档标签匹配算法基础上,分析其中存在的一些问题,提出一种基于XML schema的匹配算法。该算法利用宽松标识方法,将XML schema所包含的丰富的结构信息和语义信息,结合基于上下文的结构匹配算法来共同完成匹配任务。实验验证该算法能够有效识别XML文档中同名异义、异名同义现象,对异构XML文档标签的匹配起到较好的效果。　　众所周知,从一个角度或者一个层面不可能完全表征数据,而要从多层面和多角度去发现数据间的关联,这是一切匹配算法的一般原理。为了增加匹配的精度,为了充分进行数据间的匹配,本文的第四章引入基于实例的匹配算法,研究了XML文档在既能够获得实例,又包含XML Schema情况下的匹配问题。该算法主要讨论了利用实例的各种特征,提出了抽取数据分布特征向量结合数据属性特征向量来共同描述数据特征的方法,然后将得到的组合向量作为神经网络的输入,利用神经网络来计算叶子标签之间的相似性,最后,利用这个结果结合第三章提出的匹配算法,共同完成基于实例、同时能够获得语义和结构信息的XML文档标签的匹配研究。　　文章通过实例对上述两种算法的匹配过程做了详细描述,指出了影响匹配过程的关键问题,并给出了算法的匹配结果,证明了所给算法的正确性和有效性。由于针对XML文档的匹配研究尚处于发展阶段,还有很多工作要做。因此文章最后对今后这项研究的发展趋势进行了探讨。　　

其他文献

嵌入式应用系统安全体系的设计与实现

嵌入式技术与Internet技术的发展与结合,促成了嵌入式Internet技术的诞生。随着计算机硬件、软件、通讯技术的迅速发展,尤其是网络的广泛使用,需要嵌入式系统的应用跨网段、

学位

嵌入式应用系统网络安全Kerberos身份认证数字认证

教育资源管理系统网格平台的研究与实现

随着网络教育的发展，网络教育资源飞速增长，海量的教育资源既为网络教育带来了强大的服务功能，也为资源的建设与管理带来了新的挑战。由于资源建设缺乏统一完善的标准，导致网络上

学位

网格SCORM资源异构共享

物联网测床可扩展性的研究

物联网被称为继计算机、互联网之后世界信息产业发展的第三次浪潮,在我国它同样引起了政府、企业和学术界的高度关注。然而,目前还没有非常好的实验平台来进行物联网实验。去

学位

物联网物联网实验可扩展性VMNet仿真器

基于网络编码的无线传感器网络能量有效多径路由协议

无线传感器网络是当前一个热门的研究领域,已被广泛应用到各种领域。在无线传感器网络中,传感器节点的主要任务是收集、保存数据,并通过多跳方式将数据传输到汇聚节点。然而

学位

无线传感器网络多径路由协议网络编码蚁群算法能量有效

宝钢热轧质量分析系统的设计与实现

宝钢公司不锈钢分公司从投产至今二十余年所积累的在线质量监控数据是一个不可多得的“宝库”,但一直没有从中挖掘,造成在产品的质量管理中对产品缺乏定量的、权威性的、有科

学位

热轧异常诊断.NET傅立叶变换质量分析

基于数据挖掘的生物序列聚类研究

近年来随着人类基因组计划的完成，生物学研究取得了重大突破，尤其是核苷酸序列研究的进步使得生物系统分类的基础发生了重大的变化，分类系统已经或正在随着分子标准的不断渗入而

学位

数据挖掘生物序列聚类数据场方法聚类算法核苷酸序列

面向服务计算的高可用服务注册中心模型研究

随着面向服务计算领域近年来的迅猛发展,互联网上可用的服务数量的激增的同时,新的问题也逐渐凸显。一方面,目前的服务搜索机制可以快速地找到符合用户查询条件的服务,但是并

学位

面向服务计算可用性服务质量注册中心

基于PETRI网的松耦合环境下可靠服务组合的建模与分析

Web Service出现以后,服务组合系统的松耦合性、自治性使得不同于集中型系统下的可靠性问题突显出来。服务组合系统一般由广域网连接起来的计算机所组成,其中的子部件常常会

学位

Web ServicePetri网可靠服务组合Markov链复合运算补偿

基于Web服务的第三方物流信息系统

本文首先分析物流的概念和第三方物流的概念,提出从系统管理的角度分析和设计基于Web服务的第三方物流信息系统。参考BP和WS-I标准,对SOA体系结构的中的SOAP、WSDL和UDDI三个

学位

第三方物流SOAWeb服务开源

基于Web3D技术的电子商务应用研究

当前，计算机网络技术迅猛发展推动了电子商务的应用和普及，也改变了消费者和供应商之间的交易方式。从过去只能去商场的面对面购物的方式，变成现在消费者可以从网络上方便地订购

学位

Web3D技术虚拟商品交易方式三维虚拟商品系统平台

XML文档匹配研究

其他学术论文