论文部分内容阅读
在互联网飞速发展的背景下,海量数据是互联网发展的必然结果,而大规模数据的开放式共享则是网络时代的必然需求。由于系统的定制性和历史原因形成的数据封闭性、数据孤岛等难题严重阻碍了科学数据的有效共享。为了解决异质异构数据的集成与共享,浙江大学网格实验室致力于利用语义与网格技术来解决这个难题,并开发出DartGridV3语义数据库网格系统。DartGridV3利用基于语义视图的语义映射和查询重写的思想,解决传统数据资源语义化的关键问题,实现分布式数据库的语义集成。作为一个发展中的内核平台,DartGridV3仍有一些地方需要完善。首先是提高分布式查询的效率,其次完善DartGrid内核对Sparql语法的支持。本文在分析原有DartGridV3内核基础上,借用传统分布式数据领域中半连接操作的思想,提出了基于SPARQL的分布式语义查询优化算法,并介绍了具体的实现过程。同时,对于部分新增SPARQL语法的设计和实现,本文也给予了具体的介绍。DartGridV3内核是一个坚持面向实际应用的语义数据网格系统。基于V3内核,我们开发了数据库全文检索引擎和Web查询处理系统,有效地解决了中医药领域科学数据库的集成与共享。