论文部分内容阅读
随着信息与通讯技术的快速发展,大数据、人工智能、区块链等技术与传统经济形态的深度融合和广泛应用已成为当前经济社会发展的新的动能,我们正在加速迈向知识经济和数字经济时代。知识经济时代,知识创新过程必须依赖科学研究与技术研发活动的有效开展,知识创新的基础种子往往来源于科学研究。同时,我们处于信息爆炸时代,学术成果数量的增长速度显著提升,知识创新主体在研发活动中的机会和选择更加复杂。在此背景下,以数据密集型计算为基础的第四范式的兴起,在为科学研究活动提供了新的方法和工具的同时,也促使科研人员的知识创新方式在广度和深度上都发生着质的变化,基于知识的创新驱动发展过程越来越依赖于对已有学术成果的挖掘与拓展。在多样化的知识碎片和纷繁复杂的知识体系中快速有效地识别科学研究前沿将有助于科研人员在研发初期迅速锁定研究目标、制定研究计划和技术路线,极大地节省科研人员的精力,同时这也是科研管理部门制定战略规划、进行战略布局和开展学术指导的一项重要内容。因此,快速发现并科学准确地把握研究前沿不仅是科研人员关注的焦点,更是科研管理部门乃至各国政府战略决策的迫切需要。
本文首先对当前国内外研究前沿的概念特征、识别方法与特征指标以及测度方法等相关研究进行了广泛调研和述评,剖析了这些方法的不足和局限性,提出了本文要解决的问题,即:一是从情报学和情报研究的视角重点对科学研究前沿特征指标的测度方法进行优化和改进;二是对现有主题识别方法进行改进。通过对情报学语境下和情报研究过程中的科学研究前沿概念的界定,认为“研究内容新颖性”和“研究主题学科交叉性”是科学研究前沿最为显著的表现特征。在此基础上,本文从知识网络演化的视角出发,构建了基于多模异质网络挖掘与深度学习结合的科学研究前沿特征探测模型(简称MHN-DL模型),该模型包含三个子模块,分别是:基于知识网络挖掘的主题识别与演化分析方法、基于知识网络挖掘的主题新颖性测度方法和基于知识网络挖掘的主题学科交叉性测度方法,并对所构建方法进行了可行性分析和有效性验证,旨在为科学研究前沿特征探测指标体系的构建提供理论和方法支撑,在此基础上开展了实证研究和应用结果分析。
本研究的创新点体现在如下方面:
(1)改进和优化了科学研究前沿特征探测指标与计算方法,重点从内容特征和网络结构角度设计了主题新颖性和主题学科交叉性测度指标和计算方法。通过对科学研究前沿的显著性特征指标(主题新颖性指标和主题学科交叉性指标)的相关测度方法及其存在问题的研究和探讨,研究和构建了基于知识网络挖掘的主题新颖性与主题学科交叉性测度方法。在主题新颖性探测方面,在主题相似度计算的基础上构建了基于知识网络挖掘的内容特征因子计算方法,进行基于内容的主题新颖性测度研究,实验结果表明本文设计的方法有效地避免了当前研究方法中主题新颖性计算过程中阈值设定的主观性和计算结果中存在的区分度不够等问题;在学科交叉性探测方面,通过对Rao-Stirling指数的改进构建了基于知识载体网络挖掘的主题级学科交叉性测度方法,实现了对主题的学科多样性和凝聚性指标进行测度,并为学科交叉知识点的识别和挖掘提供了方法支撑。
(2)改进和优化了现有的主题识别与表示及其演化分析方法,为科学研究主题识别与表示及其演化关系挖掘提供了新的思路和方法。为了更加准确地识别和表示科学研究主题并在此基础上进行主题关联,实现主题演化关系挖掘与前沿特征探测,研究并构建了基于知识网络挖掘的主题识别与演化研究模型。首先利用知识基因识别算法,对研究领域内较为活跃的知识基础进行了识别,并在其基础上采用语块分析技术和深度学习算法进行文本深度训练,得到Chunk2vec模型并进行领域知识基础扩展,然后结合领域知识研究基础及其扩展的新兴研究主题进行聚类分析,并通过时序分析研究了不同时间段内的主题关系,构建了主题演化网络,为科学研究主题识别表示与演化关系挖掘提供了新的方法和工具。
最后,本文分别选取以图书馆、情报与档案学领域为代表的中文学术文献和以超材料研究方向为代表的英文学术文献进行了领域研究前沿特征探测实证研究和应用效果评价,验证了本文所构建的基于知识网络演化分析的研究前沿特征探测方法在实际应用场景下的可用性,结合研究主题前沿特征测度结果对其中部分研究主题进行了解读,并根据研究结论提出了相应的政策建议,如在科技评估与学术评价中要兼顾主题新颖性与被引表现,区分短期引用行为与长期学术生命力、关注和挖掘学科交叉知识点等,该结果在情报研究与科技评估、学科发展战略规划等方面具有一定的支撑作用和应用价值。
本文首先对当前国内外研究前沿的概念特征、识别方法与特征指标以及测度方法等相关研究进行了广泛调研和述评,剖析了这些方法的不足和局限性,提出了本文要解决的问题,即:一是从情报学和情报研究的视角重点对科学研究前沿特征指标的测度方法进行优化和改进;二是对现有主题识别方法进行改进。通过对情报学语境下和情报研究过程中的科学研究前沿概念的界定,认为“研究内容新颖性”和“研究主题学科交叉性”是科学研究前沿最为显著的表现特征。在此基础上,本文从知识网络演化的视角出发,构建了基于多模异质网络挖掘与深度学习结合的科学研究前沿特征探测模型(简称MHN-DL模型),该模型包含三个子模块,分别是:基于知识网络挖掘的主题识别与演化分析方法、基于知识网络挖掘的主题新颖性测度方法和基于知识网络挖掘的主题学科交叉性测度方法,并对所构建方法进行了可行性分析和有效性验证,旨在为科学研究前沿特征探测指标体系的构建提供理论和方法支撑,在此基础上开展了实证研究和应用结果分析。
本研究的创新点体现在如下方面:
(1)改进和优化了科学研究前沿特征探测指标与计算方法,重点从内容特征和网络结构角度设计了主题新颖性和主题学科交叉性测度指标和计算方法。通过对科学研究前沿的显著性特征指标(主题新颖性指标和主题学科交叉性指标)的相关测度方法及其存在问题的研究和探讨,研究和构建了基于知识网络挖掘的主题新颖性与主题学科交叉性测度方法。在主题新颖性探测方面,在主题相似度计算的基础上构建了基于知识网络挖掘的内容特征因子计算方法,进行基于内容的主题新颖性测度研究,实验结果表明本文设计的方法有效地避免了当前研究方法中主题新颖性计算过程中阈值设定的主观性和计算结果中存在的区分度不够等问题;在学科交叉性探测方面,通过对Rao-Stirling指数的改进构建了基于知识载体网络挖掘的主题级学科交叉性测度方法,实现了对主题的学科多样性和凝聚性指标进行测度,并为学科交叉知识点的识别和挖掘提供了方法支撑。
(2)改进和优化了现有的主题识别与表示及其演化分析方法,为科学研究主题识别与表示及其演化关系挖掘提供了新的思路和方法。为了更加准确地识别和表示科学研究主题并在此基础上进行主题关联,实现主题演化关系挖掘与前沿特征探测,研究并构建了基于知识网络挖掘的主题识别与演化研究模型。首先利用知识基因识别算法,对研究领域内较为活跃的知识基础进行了识别,并在其基础上采用语块分析技术和深度学习算法进行文本深度训练,得到Chunk2vec模型并进行领域知识基础扩展,然后结合领域知识研究基础及其扩展的新兴研究主题进行聚类分析,并通过时序分析研究了不同时间段内的主题关系,构建了主题演化网络,为科学研究主题识别表示与演化关系挖掘提供了新的方法和工具。
最后,本文分别选取以图书馆、情报与档案学领域为代表的中文学术文献和以超材料研究方向为代表的英文学术文献进行了领域研究前沿特征探测实证研究和应用效果评价,验证了本文所构建的基于知识网络演化分析的研究前沿特征探测方法在实际应用场景下的可用性,结合研究主题前沿特征测度结果对其中部分研究主题进行了解读,并根据研究结论提出了相应的政策建议,如在科技评估与学术评价中要兼顾主题新颖性与被引表现,区分短期引用行为与长期学术生命力、关注和挖掘学科交叉知识点等,该结果在情报研究与科技评估、学科发展战略规划等方面具有一定的支撑作用和应用价值。