论文部分内容阅读
数据交换是指在两个或多个信息系统间实现数据的实时交互,以实现信息共享、达到信息资源的充分利用和优化配置。由于网络环境下的信息系统通常基于不同操作系统平台、异构数据库管理系统、不同语义描述能力和数据隔离级别的分布式数据源,所以网络环境下的数据交换需要解决数据分布性、数据模式异构性、跨平台互操作以及语义异构等问题。
针对上述问题,本文提出:(1)基于Web services的数据交换方案。数据提供方、数据请求方和Web服务注册中心协同实现数据的交换。数据提供方部署能提供交互数据的Web服务,向Web服务注册中心发布Web服务和交互数据的描述信息。数据请求方到Web服务注册中心查询服务和交互数据。服务注册中心根据服务匹配机制对发布和请求的Web服务进行匹配。数据请求方根据服务匹配结果选择并调用Web服务,获取交互数据:并根据模式匹配机制将交互数据模式和本地数据模式进行匹配,实现数据格式转换;将转换后的数据存入本地数据库或参与本地应用。(2)基于语义的Web服务匹配机制。在服务匹配过程中,综合考虑Web服务功能和交互数据的匹配程度以提高数据发现的效率。分别建立服务功能描述模型和数据描述模型并采用OWL-S描述Web服务;在服务匹配时根据服务功能和交互数据的特点使用两层匹配机制并采用不同的匹配方法;通过相似度计算和设置相关阈值选择服务。(3)基于语义的数据模式匹配机制。使用XML Schema描述数据模式并借助领域本体度量概念之间的相似程度。将待匹配的数据模式转化成模式树;对模式树中的叶结点和非叶结点采用不同的匹配算法;根据模式匹配结果,生成源模式和目标模式的字段映射关系,作为数据交换方案中“数据格式转换”的依据。
本文提出的方案和机制可实现网络环境下的数据发现、跨平台远程数据调用、异构数据模式匹配,充分考虑了数据交换的特点、Web服务功能、交互数据、模式结构以及概念的语义关系。为验证所提出的数据交换方案、Web服务匹配机制和模式匹配机制,采用Java语言实现了原型系统,系统使用网络中的三台计算机分别模拟方案中的数据提供方、数据请求方和Web服务注册中心。仿真实验结果表明,方案可完成网络环境下的数据发现、数据远程获取、数据模式匹配和数据格式转换等环节,可实现交互数据的动态提供;采用的Web服务匹配机制使交互数据在网络环境下易于被发现;采用的数据模式匹配机制具有较好的匹配准确率。