论文部分内容阅读
随着计算机技术、网络技术以及信息检索技术本身的发展,信息用户的需求呈现出网络化、集成化、智能化、个性化的特色。在图书情报领域,尤其是在数字图书馆体系架构里,基于分布式计算技术和各种互操作机制的整合检索和整合浏览,便成为我们关注和研究的重点内容之一。OAI元数据搜寻协议通过元数据搜寻和检索集成这种模式为发布Web信息的机构间实现互操作提供了一个与应用无关的互操作框架,因此,本文选择OAI作为研究对象,并探讨基于OAI-PMH开放元数据搜寻的集成信息检索系统的设计与实现。 分布式计算技术和分布式体系结构是实现互操作的基础。典型的分布式计算技术包括DCOM、RMI、CORBA、Remoting等,公认的优秀分布式计算平台包括CORBA、JINI、Web Services、Enterprise JavaBean等,本文对上述分布计算技术及分布体系结构进行了介绍并对他们各自的功能和特点作了简单比较。计算环境的互作性建立于网络、数据、应用程序和管理服务四层框架之上,而数字图书馆领域内实现的互操作模式均源于计算环境互操作性的支持。难于实现裸数据层次上的整合,因此,我们致力于系统层次上“服务”的整合。目前,分布异构信息整合检索的热点技术突出表现为:实现深层次的知识挖掘;满足知识检索的要求;实现异构信息整合检索和全息检索;满足个性化用户需求等方面。 OAI-PMH是一个低入门级的元数据互操作协议,基于XML和HTTP的POST或GET方法,实现对互联网上数据提供者元数据仓库的开放搜寻。本文对OAI协议的提出背景、OAI协议的基本特征、OAI-PMH协议规范的内容、国内外研究及应用现状进行了介绍。本论文的主要目标是设计一个基于OAI开放元数据搜寻的集成信息检索系统。因此,本论文的主要任务体现在实验环境的构造及OAI各系统模块的逻辑设计和编程实现。完成的模块包括数据提供者的OAI接口模块、服务提供者的搜寻及搜寻调度管理模块、基于搜寻到的元数据的检索服务模块。通过各模块集成实验验证,程序能基本正常运行:数据提供者能为服务提供者提供搜寻接口;服务提供者能实现对本地和互联网上的数据提供者进行开放搜寻,并在此基础上为用户提供元数据库检索服务。实验环境不等于实现环境,本文也给出了在实现环境中需解决和继续完善的有关问题。 239.50通过对编码方式和内容语义的标准化来实现不同系统间的互操作,本文对OAI和239.50的互操作机制和实现功能作了简单比较。为了构建一个健壮、高性能的OAI现实运行系统,有必要在理论上对一些关键问题加以探讨,这些问题可能包括:减少元数据转换匹配差异;查询算法选择及优化:数据仓库内容同步等。关键词:OAI元数据互操作元数据搜寻集成检索XML数字图书馆