论文部分内容阅读
本文的目标在于研究基于多DTD的XML数据源查询技术,在综合和参照现有查询方案的基础上,主要的工作如下:
◆对多DTD环境中XML文档的查询进行处理,解决XML集成中结构的异构问题。通过有效的映射模式,对多DTD实行统一管理,从而屏蔽了底层数据源结构的不一致,为用户提供了统一的查询接口。同时我们采用基于DTD的XML查询处理方法,利用DTD信息快速检索XML数据,一定程度上提高了查询效率。
◆针对多个DTD结构的不一致性,提出了实现相似结构查询的解决方案。该方法采用独特的编码方式对DTD和XML同时建立索引,然后用关系数据库存放编码结果统一进行管理。用户可根据提供的XML节点列表构造相应查询,其后系统将参照这种查询结构在数据库中搜索相似的DTD结构,并按其与原查询结构的树间距离进行排序。排序后的DTD结构将返回给用户供其选择。一旦用户选定了感兴趣的DTD结构,系统将对遵循这些DTD的XML文档进行查询处理并返回最终结果。
◆同时,本文还给出了一种利用公共视图进行查询的方法,即基于本体的XML查询。用户可以通过浏览本体构建查询,然后系统根据映射规则将用户的树查询语句转换成基于DTD的XPath查询语句,最后对XML数据源进行XPath查询并返回结果。