高校科学数据管理研究

被引量 : 0次 | 上传用户:xboaty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以高校科学数据管理为研究对象,通过对普遍意义上科学数据管理体系和过程的研究,以及将之置于高校范围内,与高校的科研活动实践及高校学术信息资源管理实践相结合,探讨高校科学数据的管理模式与实施。本文应用扎根理论的研究方法,从高校科学数据管理的背景出发,通过大量文献资料的分析研究,结合图书馆学与信息资源管理相关理论、高校图书馆学术信息资源管理实践,探讨高校科学数据管理理论体系,构建高校机构知识库的科学数据管理模式,设计技术线路并尝试实施。在具体研究线路中,本文首先通过整理与鉴别,全面收集来自科学界、图书情报学界涉及科学数据的各方面文献资料,从中获取与科学数据组织相关的理论、方法与案例,依此完成数字化科研背景下科学数据含义的分析。接着,一方面从宏观角度分析科学数据管理体系,以作为高校科学数据管理的外部环境,结合图书馆学和信息资源管理的生命周期理论、信息组织理论、信息描述理论和信息精选理论,以及这些理论在微观层面高校科学数据管理过程中的应用,探讨应用于高校科学数据管理的理论体系;另一方面通过对高校科研活动和高校科学数据特征、高校学术信息资源管理中图书馆角色的分析,构建基于高校机构知识库的科学数据管理模式。在此模式的实施过程中,本文通过对科学文献与科学数据不同特征的分析,以及对来自经济学和材料科学具体案例的分析,得出了科学数据具有作为信息资源的生命周期和映射高校科研活动生命周期的两重特性,依照“资源描述与检索”(Resource Description and Access, RDA)的规范设计科学数据资源描述框架和元数据方案,并尝试实施。基于此线路,本文研究按以下章节展开。第一章“导论”部分。分析研究的相关背景,确定本研究的选题,对来自科学界和图书情报界围绕科学数据的研究进行述评,并介绍本文的研究目的、研究对象、研究线路与研究方法等。第二章分析高校科学数据管理背景,首先从科学研究对象变化、科学研究复杂度以及信息技术发展角度讨论数字化科研的缘起,从而厘定数字化科研概念及其技术、特点、意义和相关要素,简要描述了英国、美国、欧洲和中国的数字化科研实践。继而探讨数据科学的兴起,以及“数据密集型”科研范式背景下科学数据的定义,并讨论了科学数据研究涉及的诸多问题。第三章的内容是科学数据管理理论体系。本文将科学数据管理理论体系分为宏观和微观两个层面。宏观层面不涉及管理细节和流程,仅考虑与科学数据管理相关的外在因素,即科学数据管理环境,本文认为国家层面的信息政策是科学数据管理的顶层环境,科学数据管理的目的是建立共享体系,包括标准规范制订、国家或国际特定专业领域和专门机构的相关工作、关键技术发展、共享平台架构等;出版或发布是科学数据专业化管理和可持续发展的有效形式和手段,也是高校科学数据管理的最终环节;数据科学家(data scientist)群体的扩大即人力资源的培养是科学数据管理关键。微观层面是科学数据管理过程,研究管理过程中的各个环节以及各环节之间的关系。科学数据将成为未来数据数字图书馆的主要部分,数字图书馆的有效运行,信息组织和描述是关键,在本文范围内,科学数据管理主要是针对科学数据特征实施信息组织,并最终提供共享访问。科学数据具有作为一种信息资源的信息生命周期与映射科研活动生命周期的两层含义,这是科学数据描述的依据;科学数据存档与发布是科学数据管理的重要环节,哪些科学数据将进入此环节需要信息精选理论的支撑。第四章的内容是高校科学数据管理模式的研究。研究从高校科研活动的具体分析展开,确定了高校科研活动的“当代小科学”以及教学与科研相结合的特点,从而形成高校科研活动成果以课题组为“根部”的树状结构,高校科学数据作为科研成果的部分也在其列。同样因为此特点,高校科学数据呈现了个体科研课题循环并周期发展、学科门类及其科学数据类型和格式多样、科学数据管理的“非规划性”、需要高校内专门机构统一管理等特征。高校图书馆在高校学术信息资源的传递具有传统的中介性,且学术辅助角度学术交流平台的功能也日益显现,同时,图书馆在长期的学术信息资源管理中积累了丰富的经验,因此,高校科学数据管理应有图书馆承担。更进一步,高校机构知识库长期由图书馆维护,并保存高校机构内待出版及无法出版的科研产出。从而确定了高校科学数据的机构知识库管理模式。第五章的内容是面向科研活动的科学数据管理研究。通过用户检索行为、用户科研活动与信息资源组织相关性的分析,得出以用户科研活动为中心的管理方式,即是将信息资源组织与科研活动工作流相结合,因此科学数据的生命周期除其作为信息资源的信息生命周期,更重要的如何在高校科学数据管理中映射科研活动过程,保证用户检索和利用这些科学数据时能了解其在科研过程中所处的位置,实现科研活动整个过程及其产生科学数据的连续统一体管理方式。由于高校科学数据管理的这些特点,在科学数据描述与组织时不能采用传统的科学文献处理方式,通过对比科学文献与科学数据的不同,本文利用以“书目数据的功能需求”(FRBR)和“规范数据的功能需求”(FRAD)为理论基础的RDA规范实施科学数据描述,这是建立在E-R概念模型上的规范。通过对科学数据与科学数据集等实体的描述,以及各实体间关系的描述,使复合数字对象的高校科学数据管理得以可能。第六章实证研究部分,是管理模式的具体实施。实施是建立在对具体案例分析的基础之上,通过对经济学和材料科学利用科学数据进行研究的案例分析,以及两个学科作为社会科学研究和科学工程研究,其围绕科学数据相关活动特点的对比分析,验证了之前所得出的高校科研活动及科学数据特征,也得出高校科学数据管理的具体需求。论文选取DSpace系统作为机构知识库的平台,通过分析DSpace系统的体系架构和信息组织模式,根据高校科学数据管理的特点和需求,设计了以“课题组-科学数据集-科学数据记录”对应于DSpace系统信息组织模型的"community-collection-item"的科学数据信息组织方案。元数据方案设计方面,根据技术线路中对科学数据(集)及相互关系描述的要求,构建扩展的限定性DC方案,并以对科学数据集描述为例,书写符合METS规范的文档,包含对管理元数据、结构元数据、技术元数据的封装。本文沿着高校科学数据管理背景、高校科学数据特征、高校科学数据管理特征以及高校科学数据管理模式的研究线路层层推进,得出相应的结论,最后通过实证分析,利用高校科研活动及相关科学数据的具体案例进行验证,并尝试实施研究所得出的技术线路。本研究的创新之处在于:①分析科学数据管理所依据的其本身信息生命周期与映射科研活动领域生命周期的两层特性,丰富生命周期理论,发展学术信息资源的信息组织理论;②结合机构知识库平台,将高校科学数据管理中信息组织的颗粒度定位至单个科学数据记录,突破以往研究与实践中科学数据集为最小管理对象的数据目录或档案管理的方式。
其他文献
公路高边坡具有数量多、地质条件复杂及施工速度快等特点,施工期变形破坏事例频发。基于这一现状,依托皖南山区汤屯高速公路,提出一套操作性强的公路高边坡优化设计研究方法
全球经济一体化潮流下,中国国有商业银行面临的内外部竞争形势日益严峻,国内各家股份制商业银行和地方性商业银行的兴起、金融服务领域对外资银行开放步伐加快,这些都给国有
近年来,中国投资者“走出去”步伐加快,海外利益与日俱增,如何在复杂多变的国际环境中,最大程度减轻海外投资风险,成为一道必须回答的问题。应该看到,与其他风险不同,政治风
受爆破松动影响,地下洞室开挖后围岩强度会有所降低,根据松动损伤程度将其视为一个连续的三维"参数场"。由围岩松动圈的形成机制,分析地下洞室开挖后松动圈的计算方法,提出考
<正> 《繁星》是巴金赴法国留学途中在轮船上写的一篇抒情散文。文章由三个相似的自然段组成,都是先写看到的景物,再写自己的感受。但时间不同,地点不同,周围环境不同,作者的
随着全球经济地快速发展、人口数量地不断增长,自然资源耗竭和环境污染问题日渐严重,企业如何有效地进行环境成本管理成为一个重要的研究课题。人们已经认识到企业的生产经营
本文认为文艺生产方式由文艺生产力和文艺生产关系构成;文艺生产力是一种具有审美属性的生产力,是以文艺家的个体劳动和个性创造为主的生产力;文艺生产力的发展必然带来文艺生产
企业承担社会责任是世界企业发展的一个重要潮流。我国企业自觉履行社会责任既是应对全球竞争的客观需要,也是落实科学发展观和构建和谐社会的重要途径。我国房地产行业经过
DRM是数字内容商为了保护数字内容版权而采取的技术手段,文章在介绍目前国内常见的DRM技术标准,分析其存在弊端的基础上,对如何制定本土化DRM技术标准提出了六点建议。 DRM
经济全球化是21世纪对全世界范围内的经济发展具有决定性影响的时代性趋势,我国在这一趋势下的经济发展实践,也推动了我国经济新形势的形成与发展新格局的构建,在提升我国国