论文部分内容阅读
随着南海主权问题近几年的不断升温,南海各声索国竞相提出拥有南海岛礁的历史证据或国际法的相关材料作为佐证,对我国的主权主张构成了严峻的挑战。国内外的大量历史文献资料都记录了我国对南海的主权行使,包含着符合国际法院要求的各种证据。如何从相关的历史文献资料中获取有价值的证据,实现文献之间的关联、融合,构成强有力的文献证据链条,对于维护我国南海主权有着重要的意义。南海文献证据链构建涉及多种类型资源,如文献资源、南海概念资源、作者资源和机构资源等。现阶段南海文献证据链的形成,往往只是借助人工梳理,还停留在纸质文献的阶段。面对大量的分布异构资源数据,人工构建证据链很难梳理其深层的关联,同时又效率低下。为了解决南海文献证据链构建中的数据分布异构、关联等问题,本文使用语义网(Semantic Web)及其相关技术构建了南海文献证据链的支撑服务框架模型。在对语义网的核心技术(可扩展标记语言、资源描述框架、本体)、关联数据等技术的简要介绍后,进一步探讨了关联数据技术、本体技术在南海文献证据链构建中的意义及应用方法。基于此,提出基于关联数据的南海文献证据链支撑服务的三层框架模型,包括:(1)第一层:基于混合本体法的南海问题各类型资源本体模型构建。本体模型为南海问题各类型资源提供了语义化描述的规范,其中文献资源核心元数据本体和南海问题本体是混合本体的重要部分。文献资源核心元数据本体能够解决不同类型文献资源间的元数据描述的结构差异,实现元数据的语义融合,进而实现不同类型文献资源的语义链接和互操作。南海问题资源本体通过对南海问题概念的分析构建,并使用SKOS描述语言对其中的概念及其关系进行描述。作者、机构资源直接复用、重写已有本体;(2)第二层:基于关联数据实现南海各类型资源数据融合。基于构建的文献资源核心元数据本体对证据链文献资料进行语义描述,转化为具有唯一URI标识的语义化数据。将南海问题资源通过其本体进行描述,形成语义化的RDF数据。同时对其他知识资源(机构、人物等)复用已有本体进行描述,并转化为相同的RDF格式描述。这样,文献资源与南海问题资源及其知识概念、其他知识资源的RDF链接就实现了资源的扩展和关联,已有资源能够融合形成一个完整的证据集合,并能与外部资源实现RDF语义链接;(3)第三层:南海文献资源关联数据在证据链中的支撑服务应用。首先,由于关联数据的具有语义信息,在用户查找相关概念时,其获取的结果就囊括了与此概念相关(上位概念、下位概念、同义概念)的所有证据文献资料,这样有利于已有证据的深层挖掘;其次,包含语义信息的关联数据本身就包含了领域知识的结构,所以形成的关联数据有利于证据知识的有序重组;最后,发布的关联数据可以实现与其他数据集的无缝链接,有利于在已有证据的基础上获取新的证据来源。本文基于混合本体对各种类型资源数据进行语义描述与集成,生成关联数据并发布,试建了证据文献资源之间以及与其他类型资源数据的关联、融合,以期实现:(1)分布异构证据文献资源的融合与语义互操作;(2)南海问题各种相关资源之间的链接,将所有资源有序地组织为一个整体;(3)为南海文献证据链的构建提供支撑服务,如检索、浏览与证据扩充服务等。本文通过构建的三层框架模型拟实现对文献证据链的支撑服务,对关联数据技术在南海文献证据链构建中所发挥的作用做了详细介绍,并举实例体现其优势,说明了构建的三层框架模型对于完善南海文献证据链具有一定的支撑服务意义,有助于我国南海主权的维护。