论文部分内容阅读
随着预印本存储的流行,越来越多的科学期刊允许接收预印本存放的文章,越来越多的学者把他们的研究手稿张贴在诸如arXiv等电子印本存储平台。在学术交流的过程中,一篇文章的电子印本版本和发表的期刊版本都在不断接受着其他学者的引用,即在获得着引用的奖励。由此引发了针对同一份研究成果不同版本的引用统计问题。当存放在arXiv上的电子印本同时有其对应的期刊发表版本的文章时,有必要深刻探究这同属于一项研究成果的引用统计。合并arXiv电子印本(arXiv版本)的引文数与相应的已发表期刊文章(出版商版本)的引用计数成为引文分析中的一个重要问题。本文以同时有arXiv电子印本版本与期刊发表版本的文章为研究对象,探究如何合并一篇文章两种版本的引用计数。具体研究内容包括:(1)本文对五个流行的书目存储库Google Scholar、Web of Science、Scopus、NASA 天体物理数据系统(the National Aeronautics and Space Administration Astrophysics Data System,NASAADS)以及 INSPIRE(高能物理信息系统)所采取的针对一篇文章两种版本引用整合的处理策略进行了调研。这一调查研究不仅让我们了解文献数据库对待引用整合问题的处理方式,也能为本文的引用合并方案提供一定的借鉴。(2)针对属于一篇研究成果的两种版本所各自获得的引用,提出相应的引用合并方案,为定量科研评价提供更加客观准确的论文引用计数。具体来说,以arXiv电子印本形式出现且在期刊发表的文章为研究对象,通过识别arXiv版本和出版商版本的两个公开可利用时间,把arXiv存放的文章划分为两种类别,并将两个公开可利用日期作为引文统计的起点。据此,针对每一种类别的arXiv存放文章,本文从完整的引用统计及研究评估的视角分别提出了相应的方案来合并两个版本的引文数,此外,本研究还提出了一个基于研究成果的引用整合方案。(3)从微观到宏观层面,把引用合并公式应用到定量科研评价中,以此证实合并方案的有效性及稳健性。本研究调查了 arXiv.org“计算机科学-数字图书馆”主题(Computer Science-Digital Libraries,cs.DL)1998 年至 201 8 年的 2662份电子印本,并使用相应的引文合并方案计算了 arXiv存放文章的合并引文数。进一步的,把引文合并方案应用到单篇论文、个体学者以及科学期刊的引用影响力的评价中。这些实证检验旨在证明本文提出的引用合并方案的可行性和有效性,同时为引用合并公式提供更多的应用场景。本文立足于引用统计及科研评价的视角,以同时具有电子印本和期刊发表版本的学术文章为研究对象,开创性的探究了同一研究成果不同版本的引用合并策略,为学术论文提供了更加完整准确的原始引用数据,进而有利于更准确的设计文献计量学指标,丰富和发展了基于引用影响力的定量科研评价体系,拓宽了引用分析的相关理论探究,同时为书目存储库中论文的引文统计实践提供了重要的参考价值。本文的创新之处在于:(1)提出了一个新的问题:如何实现电子印本与相应的期刊发表论文的引用合并?有鉴于此,本文首次系统地调研了流行书目存储库的引用合并现状,并发现了诸多有趣的现象,丰富了对书目存储库有关引用的探索。这一调研过程不仅让我们了解现存数据库对待引用整合问题的处理方式,同时还能为以后对其他书目存储库有关引用合并的调研提供借鉴。(2)首次系统地探究arXiv版本和对应出版商版本文章的引文合并。从文章完善的引文统计以及基于引用影响力的科研评价视角,提出了相应的引用合并方案。所提出的引用整合方案,有利于更加准确的评价单篇论文、学者、期刊以及arXiv存储库基于引用的影响力。因此,本研究试图为不同版本的引文合并提供新的思路,对书目存储库在实践中完善引文统计提供借鉴,同时为定量科研评价提供更加客观准确的论文原始引用数据。(3)结合arXiv上cs.DL主题,首次从单篇论文、研究人员以及期刊三个不同的视角,依次把引用合并公式应用到科研评价中,实验的结果证实了本文所提出方案的有效性及稳健性。这必将有助于引用合并公式在其他学科领域的实证应用,推动一篇文章不同版本引用合并的进程。