论文部分内容阅读
随着网络技术和通信技术的发展,用户越来越倾向于通过网络来查找自己所需要的资源,这在一定程度上促进了数字图书馆和各种教育资源库的发展,针对各种资源所开发的检索系统也随之增多。对于用户来说,需要频繁的登陆各个数据源获取信息,消耗了大量的时间和精力。这就需要有一个统一的检索平台,能够集成各个分布的异构数据源,提供统一的检索界面,以统一的格式展示不同数据源的信息。面向服务的体系结构(Service-Oriented Architecture,SOA)是一种新兴的粗粒度、松耦合的软件架构模式。作为SOA的实现技术之一,Web服务技术具有跨平台、跨语言、可扩展性强等特点。基于Web服务的SOA非常适合应用系统的集成和跨平台数据通信等工作。基于以上背景,本文首先对异构数据源统一检索系统的相关理论和技术作了简要的阐述,接着采用面向服务的体系架构,提出了一个异构数据源统一检索系统架构。为了规范和统一处理异构数据源的检索服务以及方便检索结果的统一展示,提出了检索服务统一模型和元数据模型,详细阐述了统一检索算法、检索结果融合算法和元数据更新算法,然后对于系统的功能、数据库结构、系统各部分之间的关系以及系统的核心模块进行了详细的设计。最后,本文实现了原型系统,详细阐述了各个模块的实现细节,包括用户管理、服务注册、检索请求处理、检索服务分发和调用、检索结果融合、统一检索、元数据更新、服务管理以及数据源端检索服务开发样例。基于SOA的异构数据源统一检索系统结合元数据整合模式和中间件模式的优点,采用边检索边充实本地元数据库的检索策略,同时能够保持元数据库与数据源的同步,具有较高的检索效率。系统具有较高的集成能力,能够实现异构数据源检索接口的透明集成,数据源可以“即插即用”,具有跨平台、可扩展、可维护等优点,具有较高的实用价值。