XML文档匹配研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:laowangtou2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,人们对于XML数据的转换、集成和共享的需求越来越多,异构XML文档的匹配研究成为新的研究热点。虽现已存在一些相对成熟的针对结构化数据(如数据库数据)的匹配方法,异构XML文档标签的匹配方法可以借鉴这些方法中的思想,但同时还需要结合半结构化数据自身的特点,探寻更适合于半结构化数据自身特点的匹配算法。  本文详细地阐述了现有模式匹配方法的分类、特征和适用范围。并在针对已有的异构XML文档标签匹配算法基础上,分析其中存在的一些问题,提出一种基于XML schema的匹配算法。该算法利用宽松标识方法,将XML schema所包含的丰富的结构信息和语义信息,结合基于上下文的结构匹配算法来共同完成匹配任务。实验验证该算法能够有效识别XML文档中同名异义、异名同义现象,对异构XML文档标签的匹配起到较好的效果。  众所周知,从一个角度或者一个层面不可能完全表征数据,而要从多层面和多角度去发现数据间的关联,这是一切匹配算法的一般原理。为了增加匹配的精度,为了充分进行数据间的匹配,本文的第四章引入基于实例的匹配算法,研究了XML文档在既能够获得实例,又包含XML Schema情况下的匹配问题。该算法主要讨论了利用实例的各种特征,提出了抽取数据分布特征向量结合数据属性特征向量来共同描述数据特征的方法,然后将得到的组合向量作为神经网络的输入,利用神经网络来计算叶子标签之间的相似性,最后,利用这个结果结合第三章提出的匹配算法,共同完成基于实例、同时能够获得语义和结构信息的XML文档标签的匹配研究。  文章通过实例对上述两种算法的匹配过程做了详细描述,指出了影响匹配过程的关键问题,并给出了算法的匹配结果,证明了所给算法的正确性和有效性。由于针对XML文档的匹配研究尚处于发展阶段,还有很多工作要做。因此文章最后对今后这项研究的发展趋势进行了探讨。  
其他文献
嵌入式技术与Internet技术的发展与结合,促成了嵌入式Internet技术的诞生。随着计算机硬件、软件、通讯技术的迅速发展,尤其是网络的广泛使用,需要嵌入式系统的应用跨网段、
随着网络教育的发展,网络教育资源飞速增长,海量的教育资源既为网络教育带来了强大的服务功能,也为资源的建设与管理带来了新的挑战。由于资源建设缺乏统一完善的标准,导致网络上
物联网被称为继计算机、互联网之后世界信息产业发展的第三次浪潮,在我国它同样引起了政府、企业和学术界的高度关注。然而,目前还没有非常好的实验平台来进行物联网实验。去
无线传感器网络是当前一个热门的研究领域,已被广泛应用到各种领域。在无线传感器网络中,传感器节点的主要任务是收集、保存数据,并通过多跳方式将数据传输到汇聚节点。然而
宝钢公司不锈钢分公司从投产至今二十余年所积累的在线质量监控数据是一个不可多得的“宝库”,但一直没有从中挖掘,造成在产品的质量管理中对产品缺乏定量的、权威性的、有科
近年来随着人类基因组计划的完成,生物学研究取得了重大突破,尤其是核苷酸序列研究的进步使得生物系统分类的基础发生了重大的变化,分类系统已经或正在随着分子标准的不断渗入而
随着面向服务计算领域近年来的迅猛发展,互联网上可用的服务数量的激增的同时,新的问题也逐渐凸显。一方面,目前的服务搜索机制可以快速地找到符合用户查询条件的服务,但是并
Web Service出现以后,服务组合系统的松耦合性、自治性使得不同于集中型系统下的可靠性问题突显出来。服务组合系统一般由广域网连接起来的计算机所组成,其中的子部件常常会
本文首先分析物流的概念和第三方物流的概念,提出从系统管理的角度分析和设计基于Web服务的第三方物流信息系统。参考BP和WS-I标准,对SOA体系结构的中的SOAP、WSDL和UDDI三个
当前,计算机网络技术迅猛发展推动了电子商务的应用和普及,也改变了消费者和供应商之间的交易方式。从过去只能去商场的面对面购物的方式,变成现在消费者可以从网络上方便地订购