论文部分内容阅读
[目的/意义]为有效挖掘领域研究热点与集群,规避单纯基于频次统计的热点排序方法所存在的弊端,以及基于高频关键词共词网络集群发现方法所带来的偏差.[方法/过程]提出利用无向加权PagaRank算法进行研究热点排序,综合考量关键词之间共现的数量和质量,同时强调全部关键词共词网络的重要性,综合Node2vec表示学习和t-SNE聚类算法对全部关键词进行集群发现,以国际深度学习领域研究文献为例,分别进行热点排序和集群发现.[结果/结论]研究表明PageRank算法不仅能够区分频次统计算法无法区分的排名,而且从整体网络结构衡量研究热点,综合考量共现的数量和质量,使排序结果更为准确;整合Node2vec和t-SNE算法进行研究集群发现,可有效改善单纯利用高频关键词进行集群发现的不足,避免在有限的关联密切的高频关键词之间强制分门别类;综合热点和集群发现方法,可在凸显热点的基础上描述集群细节,有效揭示集群脉络.