基于论文特征进行高Usage文献的识别

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:shijianwu2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
被引频次是学术论文评价中应用最广泛的指标,与此同时,学者对网络平台论文的下载、点击,等其他效用指标的关注也越来越多,WoS平台发布的的学术用量级指标Usage,在论文评价领域提出了新视角。本研究从论文作者、发表的期刊、所在研究机构等外在因素和论文篇幅、作者数量、参考文献数量等内在因素两方面对比分析高低Usage论文的异同,并尝试通过机器学习的方法实现高Usage论文的预测,以探索高Usage论文的成因。本研究以WoS数据库2013年发表的“COMPUTER SCIENCE ARTIFICIAL INTELLIGENCE”学科下的11008篇论文的题录信息作为原始数据;按照Usage指标降序排序,选取前5%共550篇论文作为高Usage论文集;下载全记录格式的题录信息作为高Usage论文数据集,另外按照发布时间排序取并排除掉高Usage论文的550篇文献,下载全记录格式的题录信息,作为低Usage论文数据集。全部数据下载时间为2018年11月,最终获得1100篇论文的题录信息作为原始数据,然后根据作者机构和期刊的信息,分别在WoS平台的ESI数据库和JCR年度报告中获取论文的机构和期刊的指标数据。研究发现:(1)论文自身特征:两种论文合著率均比较高,高Usage论文的参考文献数量明显大于低Usage论文,而作者数量、论文篇幅,两种论文集不存在显著差异。(2)论文作者:无论是作者的发文量、h指数、还是总被引频次,低Usage论文作者相比于高Usage论文作者,明显处于弱势。(3)论文所在机构:两种论文所在机构在发文量、总被引频次、被引频次/发文量上均不存在显著性差异。这一点与论文作者量化指标不同,作者所在机构的影响力对论文Usage的影响远没有上升到显著水平。(4)高Usage论文所在期刊的总被引频次明显高于低Usage论文所在期刊;在被引半衰期和引用半衰期上高Usage论文也略高一些,但影响因子JIF、发文量、以及文章影响值两种论文不存在显著差异。结果表明,高Usage论文主要集中在,参考文献多,研究基础扎实,作者影响力大,期刊影响力大,引用较新,老化速度较慢的期刊。(5)对比发现CHAID决策树分类模型对Usage指标预测效果最好,模型匹配度较高,在测试集上预测准确率都达到84%以上。
其他文献
随着我国经济的日益繁荣,经营者集中的现象已经非常普遍。经营者集中并不是一定会形成垄断从而破坏正常的竞争秩序,它也能形成规模经济,促进国民经济的发展,同时给消费者带来
Bent函数是具有最优非线性度的布尔函数,其在密码、编码以及组合数学等领域均起着重要的作用。就目前来看,对bent函数的完全分类似乎是不可能完成的任务,已知的bent函数仅占
斜入射光反射差(Oblique-incidence reflectivity difference,简写OIRD)技术是通过检测椭圆偏振反射光中s/p成分的变化,对各种表面变化和表面过程进行实时无损探测的一种光学技术。近十年来OIRD技术生物化学分析领域如免疫检测、生物芯片和生物分子相互作用研究等方面展示了巨大的应用潜力,具有无需标记、实时在线、高通量检测和适用于各种基底等突出优点。然而,目前的研
西藏山南温·吉如寺所藏古籍是近年来发现的重要藏文古籍文献。一经发现即被国内外藏学家界高度重视,相关研究报告也层出不穷。本篇学术论文是本人多次进行实地调研,详细了解该寺所藏古籍文献,大量查阅相关历史资料,综合运用文献学、历史学、人类学等方法,对温·吉如寺所藏古籍文献进行针对性研究。对以下几个方面内容进行了探讨和思考;第一章对选题背景、研究现状和研究方法进行了综述。第二章通过文献学简要介绍吉如寺所藏古
油菜的含油量高达百分之五十,是一种重要的油料经济作物,广泛的种植于世界各地.但恶劣的环境会严重的影响油菜的生长发育和产量.在各种非生物胁迫条件(如低温,高温,干旱,盐碱性,脱落酸)中,干旱胁迫是油菜生长发育过程中一个非常常见的不利因素.因此:研究油菜在干旱条件下的生理响应机制具有重要意义.而利用油菜转录组数据构建基因共表达网络研究油菜响应胁迫关键基因的方法则是一个很好的工具.本文利用油菜在干旱处理
庙3油田开发面临的问题较多:已开发动用区块周边地层对比标志不清,沉积相与砂体研究不够深入;地层能量不足,注水开发效果差;储层低渗,油井产能低,动用难度大,开发效益差。针
油页岩属于非常规油气资源,是非常重要的石油替代能源,我国油页岩资源储量丰富,居世界第二位。充分开发利用我国油页岩资源,弥补我国常规油气产量的不足,这对推动我国国民经济的发展和社会稳定会起到不可估量的作用。本文在油页岩原位转化技术的基础之上,对水力压裂工艺进行优化,使用以盐酸为酸基的酸化压裂液,对汪清矿区油页岩进行酸化处理,研究经酸化后油页岩的宏观力学特性劣化特征,并结合其微观孔隙结构特征,对酸化后
血红蛋白(Hb)含有卟啉环和Fe(Ⅱ)电活性中心,具有类酶活性。通过Hb的生物催化,过氧化氢(H2O2)、O2、3-氯-1,2-丙二醇(3-MCPD)可以被电化学还原。反过来,利用Hb的类酶性质可用电化学的
非易失性随机阻变存储器具有阻变切换速度快、易于构建、低能耗等优越的性能,最有望成为下一代新颖的信息存储器。阻变存储器是利用在外部激励的作用下器件高阻态与低阻态之
半导体激光器因在光反馈,光注入或光电反馈等外部扰动下易于产生高维混沌信号而成为混沌保密通信系统理想的混沌信号源。然而通过这些扰动方式产生的光混沌信号带宽通常仅仅达到几GHz水平,这极大的限制了混沌保密通信的最大传输速率和通信容量。波分复用(WDM)技术的提出为通信系统容量的增加提供了可能。然而,目前报道的WDM混沌保密通信系统受限于波长可调谐的混沌信号源和系统成本而大多考虑两个信道的复用。因此,寻