论文部分内容阅读
近年来,随着数据的海量增长,当今世界已进入大数据时代。大数据对当今社会的各个领域带来了巨大的价值,同时也带来了巨大的挑战,所以引起了各行各业的高度重视。对大数据领域的研究热点和未来发展趋势进行分析预测,了解大数据研究领域的发展变化和重点,将对社会发展和科学研究发展起到重大的推动作用。而在大数据时代中,如何从巨量复杂的数据中提取信息,并将复杂信息更清晰明确地展现出来,最有效的途径就是借助可视化技术。如今,国内和国际上对大数据领域各个方向的研究不在少数,但大篇幅的文字综述不仅阅读时间长,且相对枯燥难懂,让一些想要对该领域进行快速了解并展开研究的研究人员望而却步,在这种情况下,利用可视化技术绘制该领域的知识图谱就成了一个很好地解决方式。国内在知识图谱领域的研究还不是太多,且大多集中在信息计量学领域,知识图谱作为一个解读复杂知识的有效工具,应用可以扩展到所有科学研究领域。为了解决上述问题,本文的主要研究工作和成果有:1、本文对知识图谱的基本概念进行介绍,并基于知网数据库,对国内知识图谱软件的使用情况进行调查,筛选出国内研究者使用最多的几种知识图谱软件,从包括软件的基本概况、支持的数据格式、支持构建的关系矩阵和数据的处理方法几个方面对软件进行比较,为研究者针对自己的研究内容选择合适的知识图谱工具提供了参考。2、本文以web of science和知网cnki数据库为数据源,采集2008年~2017年10年间的大数据相关文献为研究对象,运用科学知识图谱,从宏观到微观对文献的代表国家、关键词、共被引文献等进行可视化分析,从图谱结果中分析得出10年间大数据研究领域的重点研究方向,关键文献和热点前沿,对未来该领域的发展趋势进行了预测,并且不同于大多数知识图谱只是对高频词进行分析,本文使用快速中介中心性算法对高频关键词的中心性进行计算,进一步挖掘出高频且高中心性的关键词作为研究领域的热点进行研究,具有更高的可靠性,而且对高被引文献每年的被引次数进行挖掘,旨在发现知识基础和知识前沿的发展转化过程,对通过关键词分析得出的重点研究方向和发展趋势进行验证,进一步保证结果的准确性和科学性。3、本文通过得出的知识图谱,对国内外研究的研究情况进行对比,对国内外大数据研究领域在研究热点、研究方向等方面的相同点和不同点进行分析,对国内外在该领域的研究情况有了更全面的认识。经过以上研究工作,我们分析发现大数据领域的发文量逐年增加,中国的发文量在国际大数据研究中位于前列,国内和国外都很重视大数据在云结算、数据挖掘和数据分析方面的研究,但在侧重点上有一定差异,近年来,国内和国外对大数据领域的研究总体都在向应用方面转变,大数据领域的研究已趋于稳定。