论文部分内容阅读
在学术大数据中对作者进行学术影响力的评估是科研工作者热点研究方向,其主要基于作者所发表的文献的相关信息来衡量其在学术领域的影响力,如作者合作信息、作者发文量、文献本身价值及期刊影响力等方面进行研究,对学术活动研究具有较强的应用价值。通过对作者学术影响力的有效评估一方面可以使得科研机构或者高校寻求强有力的合作伙伴,也可以为他们在职称评定及科研奖励方面提供一定的参考性;另一方面,可以为新进某一领域的年轻工作者提供目前的研究方向并对未来研究趋势作出一定的指导;另外还可以使出版机构对那些影响力高的作者或者有潜力的年轻科研作者进行识别并与之合作,从而有助于提高机构在学术界的影响力。目前作者学术影响力评估主要分为基于统计的评估方法和基于网络结构的评估方法。基于统计的评价方法往往考虑的是文章的被引频次、发表的文献数量、作者的合作次数等指标,如h指数。但是h指数对科学家论文集中被大量引用的某一篇或者几篇论文并不敏感,另外由于该指数只针对科研工作者目前总的科研能力的评估,其评估结果是只增不减的,因此对于年轻的科研工作者并不公平等问题。针对h指数的缺陷不少学者提出了其变形如g指数、r指数等等。基于网络结构的评估方法主要分为单层和多层两大方面,由于目前单层网络的研究在面对当下庞大的学术数据时往往比较片面,而多层网络的兴起恰好弥补了单层网络的不足,可以从多个指标分析某一对象,为科研工作者对作者影响力的评估打开思路。因此,结合当前的研究状态以及遇到的研究问题,本文提出了基于三层学术网络的作者学术评估模型(即作者间引用网络(ACL)、作者间合作网络(AAL)、文献间引用网络(PCL)),提出综合评估指标M3-index,并采用改进的PageRank算法即LeaderRank算法来对作者学术影响力进行评估。其次,本文还对作者超网络评估模型结构即度定义、度中心性、特征向量中心性等进行了分析,这在目前的研究文献中涉及较少。另外,为了验证超网络模型的合理性,本文采用Aminer数据集对不同算法的排序结果进行了比较,证明了综合指数M3-index在评估作者影响力方面的优势,不仅在排序性能上更优也更能反映作者的综合科研能力以及年轻科学工作者未来的发展潜力。