融合多类新特征的科研合作预测研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:iamasg_wql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代通讯技术的不断发展和科学研究复杂度的不断增大,科研合作逐渐成为人们解决各种科学问题的有效途径。国家、机构、个人等不同形式、不同层面的科研合作关系不断涌现,相关的科研合作关系研究也逐渐引起了学者们的广泛关注。其中,为进一步促进科研合作交流和学科进步,科研合作预测研究愈发火热。相关研究以科研合著论文作为科研合作的主要表示形式之一,从文献数据本身或基于其构建的科研合作网络中提取作者间的相似性特征,以此为不同的作者推荐合适的科研合作对象。然而,通过梳理文献发现,相关研究中存在以下不足:一是未能充分利用科研合作网络的结构特征和知识属性特征对不同作者节点的重要度进行详细区分;二是相关研究常默认科研合作网络静态不变,忽略了网络中节点和边的动态变化信息;三是在使用作者外部属性信息计算作者间的相似性时,仅考虑了作者间的直接联系,忽略了作者间的间接联系。为弥补现有科研合作预测研究中的不足,本研究做了以下三点尝试:一是从网络结构、合作能力和学术影响力三个层面考察作者节点的重要度,然后将其对应的网络结构节点重要度评价指标(度中心性、接近中心性、中介中心性和聚类系数)、合作计量指标(合作率、合作度、合作系数、修正合作系数、合作能力指数)和科研成果评价指标(发文量、被引频次、H指数、G指数)与科研合作网络拓扑结构特征相结合,提出多个基于节点重要度的科研合作预测指标。二是从时间特征出发,引入活跃度、影响力、合作倾向三个指标对作者不同时间段发表的论文、不同时间段产生的被引频次和不同时间段的合作程度进行区别处理,然后将这三个指标与科研合作网络拓扑结构特征相结合,提出多个基于时间特征的科研合作预测指标。三是利用作者、关键词、机构信息分别构建作者-关键词、作者-机构二分图,在此基础上使用Sim Rank算法完成作者外部属性相似度的计算(研究兴趣相似性和合作机构相似性),该算法不仅考虑到了作者间的直接联系,也衡量了作者间的间接联系。最后,本研究将web of science核心合集作为文献数据来源,从该平台获取了Information Science&Library Science、Law、Physiology、Communication和Oceanography五个学科类别的文献数据并构建相应的科研合作网络进行实验分析。首先,在对现有科研合作预测中常用的指标和方法进行评估筛选后,将Node2Vec网络表示学习方法和基于节点结构相似性的预测方法(CN、PA、LP、Cos+)分别作为基准预测模型。然后,对基于节点重要度、基于时间特征和基于作者外部属性的科研合作预测新指标进行评估筛选,将筛选后的指标分别引入到两个基准预测模型中,构建融合多类新特征的科研合作预测模型,采用随机森林分类方法进行训练预测与分析评价。最后,为进一步验证本研究所提出的融合多类新特征的科研合作预测模型的稳定性,本研究不仅对负样本进行随机抽样以模拟更多样的数据变化情况,还选取了更多的分类方法(决策树、朴素贝叶斯、人工神经网络、逻辑回归)进行训练与预测。实验结果表明:(1)基于作者外部属性的科研合作预测指标(合作机构相似性、研究兴趣相似性)对预测效果的提升最明显;基于节点重要度的科研合作预测指标次之;基于时间特征的科研合作预测指标最后;而同时融合三种类型的指标,其预测精确度在两个基准预测模型中都产生了显著的提升效果。(2)不同正负数据样本环境下、不同分类方法中的实验结果进一步表明:本研究所提出的融合多类新特征的科研合作预测模型,其预测效果不受正负数据样本比例变化和分类方法变动的影响,在不同情况下均能产生比两个基准预测模型更为优良的预测效果。
其他文献
随着旅游多元化的发展,以亲近自然、放松身心为主要功能的乡村旅游正备受国人青睐。发展乡村旅游不仅满足了人民日益增长的精神需求,同时也激发了乡村地区的活力,有效促进乡村发展。作为中国农家乐的发源地,四川省乡村旅游资源类型多样。四川省旅游规划中明确提出要将四川打造成全国领先,国际知名的乡村休闲度假旅游目的地,加快乡村旅游聚集化、规模化发展,构建连片成带聚集发展格局。但当前快速发展的乡村旅游其空间结构尚未
学位
自二十世纪以来,城市化的快速发展导致人类活动的聚集和土地利用强度的加大,引起了城市热环境的显著变化,城市热环境对社会经济和人类健康产生重要影响。随着空间信息技术的不断成熟,遥感技术被广泛应用于城市热环境研究中。本文利用重庆市中心城区2001、2009、2019年的Landsat影像数据,DMSP/OLS数据、NPP/VIIRS夜光数据,结合研究区建成区扩张趋势,探讨了重庆市中心城区2001-201
学位
在管理实践中,尽管有很多企业都在积极倡导员工积极提出工作意见,但是员工的建言行为并不总是会被领导接受,实际上还存在着被拒绝的可能。员工的建言被拒绝往往伴随着不愉快的心理过程,其工作积极性可能也会受到影响,因此,作为员工建言的“接收者”,领导需要考虑如何尽可能避免因拒绝建言而对员工造成的负面影响。当前,关于员工建言后领导回应的研究主要关注的是建言采纳的相关前置因素,而很少探究领导是如何与建言者进行解
学位
退耕还林工程是我国在1999年提出的一项生态工程,对不适宜耕种的耕地或宜造林的荒山上实施退耕还林,旨在改善生态环境和农户生计。作为世界上最大的生态工程,退耕还林是促进人与自然和谐发展,实现经济、社会和自然环境协调发展的重要举措。党的十九大报告提出,要继续扩大还林还草。重庆市作为我国退耕还林工程的重点实施区域,地处生态环境敏感区域,是关键联结点。重庆市自2000年实施退耕还林工程以来,截至2020年
学位
<正>对学校而言,最大的挑战不是选课,也不是走班,而是让课堂焕发新的生命力,释放更多的教育能量。湖南省新高考改革实施方案已落地,为国育才的教育路径日渐清晰。对学校而言,我认为最大的挑战不是选课,也不是走班,而是让课堂焕发新的生命力,释放更多的教育能量,落实立德树人的根本任务。为此,长沙市第二十一中学在"办适合的教育,育负责的公民"的办学理念之下,开展了"三自课堂"的改革实践。何谓"三自课堂"?指课
期刊
土地资源的利用与人类活动密切相关。目前,人类活动对土地利用变化的影响及其与生态系统间的关系已然成为土地科学的研究热点。快速城市化与土地利用变化导致的一系列问题不断影响着生态系统健康。开展生态系统服务价值和生态风险的空间量化及土地利用结构优化研究,有助于科学管控区域生态用地,促进社会发展和生态文明建设。本文将三峡库区作为研究区域,以库区2000-2020年遥感影像及土地利用数据为基础,从时间和空间两
学位
通过开展云浮市观音山矿区现场地质测绘工作,查明了矿区边坡工程地质条件,并进行相应边坡工程地质分区。采用DIPS软件对所测结构面进行处理,得到地表岩层结构面的方位倾角等密度图、走向玫瑰花图和赤平投影图,分析了E区边坡变形破坏模式。同时,采用FLAC3D有限差分软件对B5剖面高边坡的稳定性进行数值模拟分析,结果表明开挖后边坡整体位移较小,边坡稳定性较好,建议采取随机锚杆+局部被动防护网与锚喷及锚索支护
会议
耕作田块是指由末级固定沟、渠、路以及田坎等围成的最小耕作区域,是耕地耕作的基本单元,简称“田块”。重庆山地丘陵区的耕作田块类型主要包括条田、梯地和缓坡地等三个类型。实施对丘陵山区因地制宜开展“宜机化”耕作田块修筑具有十分重要的实践意义,农田“宜机化”改造更应分阶段、分重点循序渐进地探索。近年来,我国在农业机械化取得可喜成绩的同时也越重视农业发展中不平衡不充分的现象,各级政府逐渐意识到对占据“半壁江
学位
1930年代是中国电影的“黄金时代”,也是中国话剧朝“演剧职业化”迈进的整体变革阶段,这一时期众多电影人和戏剧人在创作观念、创作实践上相互借鉴,使电影和戏剧这两种艺术形式在创作生产、艺术呈现、思想共振等方面相融相通,二者的双生与互动也在不断影响和快速推动着自身的历史化进程。于伶正是在这样的时代语境中成长起来的。于伶(1907-1997)是我国著名的戏剧作家、电影导演和编剧,他最为人熟知的是其剧作家
学位
柑橘是我国南方农村地区重要的支柱产业,对实现农民致富、乡村振兴具有十分重要的意义。柑橘为多年生常绿果树,其冠层特征对于树势具有重要的指征意义,能进一步分析其与生长状况、生理指标、产量的关系。因此,快速准确地获取柑橘冠层形状特征,如树高、冠层投影面积、冠层体积等,有助于肥水药精准变量施用和产量高效精准预估,促进精准农业技术在柑橘产业中推广应用。受我国柑橘产业地域分布和冠层自然生长方式影响,人工测量和
学位