基于引文网络的科研群体挖掘研究

被引量 : 0次 | 上传用户:patton
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技发展对于促进社会进步具有重要意义,而科研工作者的研究是科技进步的首要推力。科研群体的挖掘工作,有利于帮助研究者了解科学前沿的发展与分布情况,加强学者间的合作,促进新兴学科的发展,尤其对于交叉领域的科研起到强有力的促进作用。科学文献是科研工作者的成果重要载体之一,也是评价科研工作者科研绩效的参考指标。由科学文献和引证关系组成的引文网络体现了科学文献内容上的相关性及知识的传递,被广泛地用于对文章重要性进行鉴定。通过引文网络进行科研群体挖掘,将有助于发现潜在的具有相关研究方向的科研群体,推动科学合作的产生和发展。为寻找具有相关研究方向的科研群体,通过挖掘引文网络中的潜在信息,建立基于引文路径的引文分析模型,构造文章及作者相关性指标来表示科研方向的相近程度。在此基础上,引入内容相关性参数来甄别关联关系的真伪,即利用余弦定理对文章间的正文、摘要和参考文献正文进行关键词文本匹配,去除非真实相关的研究对象。然后将作者相关性指标作为距离函数,运用DBScan算法对科研工作者进行聚类,较为客观地实现科研群体的识别。最后,用原型模拟体现了算法的可行性和有效性。引文分析模型更全面地包含了引文网络相关信息,因而突破以往其他关系模式分析模型的信息量限制,能够更全面地挖掘隐蔽的科研群体网络,更好地发现潜在的合作机会。通过构造文章相关性指标和作者相关性指标来将原问题转化为聚类问题,实现了一种较为新颖的科研群体识别方法。基于引文路径的相关性指标可比性较强,改善了以往指标在定量上的不足。而文本匹配的运用和内容相关性参数的引入使得相关性指标的设计更加合理和完善,大大加强了科研群体聚类结果的可靠性。
其他文献
随着国际经济全球一体化的深入发展,国际间的贸易往来日益频繁,近几年来,中国的经济持续高速发展,进出口额一直保持在世界的前列,这无疑推动了国际航运运输业和相关物流业的
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又潜在有用的信息和知识的过程。在这一过程中,对数据的分类是数
目前各国经济依赖性不断增强、跨国人流量与货流量不断扩大,人们对航空运输业的需求随之增长,航空设备的需求量也在逐年上升。但是由于航空设备这一跨国交通工具价格高昂,航
并购是市场经济条件下企业快速集聚资本的有效途径,和内部资本积累相比,有着无可比拟的优越性。特别是第五次并购浪潮以来,以获取战略性资源、强化和扩展核心能力等为目标的
<正>一、课堂教学中激发学习兴趣在语文教学的过程中,教师要注意通过营造良好的学习氛围,激发学生的学习兴趣,保持学生的学习热情。例如在教学《小小的船》一课时,教师可以利
目的:乳腺增生病(Mammary Gland Hyperplasia, MGH)是一种既非炎症又非肿瘤的增生性病变,是以乳腺腺泡、导管上皮细胞及纤维结缔组织增生为基本病理变化的一类疾病总称,本质
目的前列腺凋亡反应因子4(Prostate apoptosis response-4, Par-4)是从凋亡的前列腺肿瘤细胞中分离出来的一种促凋亡基因,是第一个被证实的WT1(Wilms’tumor suppressor-1)的分子
研究背景和目的姜黄素(Cur)是从姜科植物姜黄根茎中提取的酚性物质,药理作用广泛,尤其抗肿瘤作用是研究热点[1]。由于姜黄素不溶于水,吸收差,易代谢,因此,研制姜黄素新剂型以
低密度奇偶校验码(Low Density Parity Check Codes—LDPC Codes)是Gallager博士在1962年提出,故又称Gallager码。之后,在Turbo码研究的巨大成功的带动下,Mackay等人重新研究了