论文部分内容阅读
2016年5月,国务院发布了《国家创新驱动发展战略纲要》,指出科技创新是发展的核心,同时也是面向未来的一项重大战略,国家应以创新成为引领发展的第一动力。由此可见国家已将科技成果的管理与发展提到了国家战略发展层面。Web2.0环境下,伴随信息技术的普及和社会信息化程度的提高,科技成果数量也飞速增加,其资源呈现出多类型、多媒体、跨时间、跨地理、跨语种等特点。面对数量庞大的异构科技成果资源,为解决其存在的开放程度低、服务粒度过大及集成度不高等问题,需要利用相关性原理和有序性原理对其进行有效组织,更重要的是在有序化基础上对资源进行深度聚合便于用户获取利用。因此,本文以“基于BIBFRAME的科技成果多维度聚合研究”为选题,借助于BIBFRAME在资源语义描述方面的优势,通过构建科技成果多维度语义聚合框架,以实现科技成果在内容维度、结构维度以及使用维度上的聚合与服务。本文按照“理论—模型—实证”的总体思路,以科技成果为研究对象,BIBFRAME框架为语义描述标准,从理论、方法和实践的角度探讨如何对科技成果语义进行标准化描述。以语义网技术为主要手段,运用知识组织、关联数据等理论及相关的方法与技术规范,揭示科技成果资源内部知识对象以及知识与对象的语义关系,使海量、多源、异构及分布式的科技成果重新组织为一个覆盖所有科技信息的资源网络。本研究不仅实现了科技成果信息在多维度上的有效聚合,也实现了基于科技成果资源聚合的知识发现与创新,同时满足了用户个性化需求。主要研究内容如下:(1)通过深入分析科技成果的概念、内涵、外延及应用状况,系统梳理了科技成果资源的类型与利用现状,并对其面临的问题进行归纳总结。在此基础上,提出将BIBFRAME应用到科技成果中的必要性与可行性,并对其应用范式进行探讨。(2)将DC、MARC、RDA等多种元数据集进行融合,并与BIBFRAME进行映射转换,在BIBFRAME的规则和约束下,实现科技成果各类型资源及其属性内容相互关联,并借助D2R关联数据工具将非结构化的科技成果资源发布为科技成果信息关联数据,最终提供基于知识关联的语义服务。(3)使用归一化的语义模型来挖掘异构科技成果的内容关联之后,可以将科技成果结构信息、科技成果内容信息、科技成果使用信息有机关联在一张巨大的语义关联网络,利用相关的技术手段与方法,将大量分散的异构科技成果资源进行聚合,从而取得信息的全貌。(4)根据所设计的科技成果多维度聚合方案开展实证研究。以CNKI中的题录信息为具体应用背景,采用直接聚合转换与间接聚合转换两种模式,使用本体描述语言OWL为BIBFRAME的描述语言对科技报告资源进行语义描述,并使以上两种模式实现其形式与内容上的融合,共同达到科技报告资源中知识内容与知识对象间的关联。科技成果的管理工作不仅关系到科技是否能真正融入经济建设主战场,也关系到不同创新主体创新能力的提高。因此,如何将海量、多元、异构的科技成果资源通过聚合的方式序化具有重要的理论意义与实际应用价值。本文以BIBFRAME的理论基础,深入的研究了基于BIBFRAME的语义描述机制,以及对科技成果资源进行关联数据的创建与发布,可实现信息资源的规范化描述、语义化的深度整合及知识化的深度揭示,显著提高了科技成果资源的利用价值。且能在一定程度上解决科技成果资源“海量”、“多源”、“异构”及“分布式”问题。