基于引用网络的主题发展分析系统

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:gra_summer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学术文献是科学研究人员明确科研方向或思路、传递学术价值信息、了解研究主题动态及发展规律的重要知识载体。伴随着学术大数据时代的到来,数字化信息资源爆炸式增长,入门学者检索信息时,很难获取、辨别与自己研究主题相关的文献资源,无法对自己的研究主题的现状及发展趋势有初步认识。因此本文设计完成了基于引用网络的主题发展分析系统,以可视化方式帮助入门学者获取主题内关键文献,完成体系化阅读需求,并基于时序引文网络完成主题发展分析。本系统包括五个功能模块,数据管理模块主要完成数据采集、数据清洗、数据格式转换、数据分布式存储及查询效率优化;文献关系分析模块有文献管理、根据引用关系构建主题初识引用网络、基于图卷积网络的社区聚类的功能;主题计量分析模块主要根据聚类的主题分类情况进行向前探查被引用关系将网络进行补齐,然后对完整的引文网络进行文献排名和网络分析;主题多维分析模块通过对文献数据进行指标定义并构建数据立方体,完成了文献数据的多维层级分析、多维整体分析;主题发展分析模块主要完成引文网络的时序划分,研究主题的热度、前沿性指标的数据建模分析。根据上述功能需求,采用JAVA语言、HDFS存储技术、Kylin分析引擎、SSM框架构建了基于引用网络的主题发展分析系统,并使用Echarts技术将分析结果可视化。本文选取学术文献数据验证了系统分析结果的可靠性,能够帮助入门学者在海量文献数据中挖掘可参考的文献资源,主题多维分析和主题发展分析一定程度上能够反映出研究主题的现状及发展脉络。
其他文献
通过时空众包,任务请求者将时空众包任务(与位置和时间相关的众包任务)提交给众包平台,众包服务器将任务分配给一组工作人员,工作人员将通过实际前往任务地点来执行任务。但是,当前的任务分配方案要求工作人员和任务请求者将他们的位置和任务的任务披露给不受信任的时空众包服务器,以有效地将任务分配给工作人员。但是这种信息披露或多或少会导致用户的隐私泄露。人们对于隐私泄露的担忧可能导致他们不愿参与到时空众包中。基
边缘计算作为一种缓解资源拥塞的策略,逐渐发展为满足物联网和本地计算需求的新范式。与传统云计算相比,边缘计算将大量的数据计算或存储迁移到网络边缘,可有效减少边缘或云服务器与用户间的传输延迟,避免网络中的流量高峰。但是,端边云设备自身的安全保障仍然是一个不可忽视的问题,端边设备大多是资源受限的设备,缺乏像云计算设备一样的保护措施,导致端边设备的防御性能更弱、被恶意设备攻击的可能性更高,其分布式特点使得
时间序列数据是指具有时序特征的特殊数据对象。一组序列是根据特定的时间间隔,进行一系列采样得到的数据。时间序列数据来源广泛,还具有数据量大、数据维度高、数据结构复杂等特点,这类数据与其他数据相比研究难度更大,也面临着更多的挑战。传统的时间序列特征提取方法通常需要人为设计特征,效率不高且有可能使特征丢失。近年来,基于深度学习的特征提取取得了优秀的成果,通过模型训练能够有效的提取特征,进而实现时间序列的
在生物医学领域,每天都会有大量的生物医学文献公开发表,而这些文献中蕴含着许多新的药物、疾病、症状之间的相互作用关系,是生物医学研究的重要资源。截至2021年2月,美国国立图书馆所设立的国际性综合生物医学信息书目数据库Medline中就已经有超过2700万篇以上的文献。从这些海量的生物医学文献中高效、准确地抽取出结构化的生物医学知识,对于加速生物医学相关领域的研究具有重要意义。当前,生物医学领域关系
在线课程的数量浩如烟海,对于学习者来说找到对自己最合适的好课程具有十分重要的意义。对于同一个技术的讲解课程,也会有很多资源供学习者选择,但是学习者很难在数量庞大的课程中选择到合适自己的课程。选择到合适自己的课程一般有两个方面的因素:一方面主动权在用户手里,用户通过课程信息和点评选择出课程,另一方面主动权在平台手中,平台通过丰富信息推荐给用户适合他的课程。所以一个深入挖掘评论用途的第三方的课程点评平
枳壳作为重要的中药材之一,是川渝、湖南、江西等地脱贫致富的重要经济作物。而枳壳病虫害的传染性和传播性严重威胁枳壳产品的产量和质量,极大地制约着乡村振兴。因此,枳壳病虫害的早发现、早治疗以及对乡村种植户病虫害防治知识与方法的普及至关重要。现阶段针对枳壳病虫害的图像识别研究仍然较少,依赖人工观察经验识别和管理病虫害效率低、准确率低。因此,基于枳壳病虫害识别算法的研究及智能识别系统的研发对于推进枳壳种植
随着互联网的快速发展,网络广告时代也随之而来。不同于传统的纸媒广告、电视媒体广告,网络广告具有可追踪的特性,所以企业对于量化广告投放效果的需求越来越强烈。但是,量化广告投放效果所需环节众多,企业开发一个功能齐全的软件需要付出巨大的人力成本,导致大部分企业尚不具备量化广告投放效果的能力。除此之外,网络广告的定价权在广告平台手中,对于企业客户,其广告花费不透明。所以,本系统的重心将放在量化广告投放效果
图像拼接技术对同一场景不同视点拍摄的一系列具有公共像素区域的图像实现配准与融合以生成一幅结构自然的高分辨率全景图像,在医学影像生成、全景摄影、智能驾驶、农业生产和林业监测上有着充分的应用。同时,图像拼接又是一项极具挑战性的任务,主要的难点可归为由拍摄视点变化导致的视差问题,以及在视点发生较多移动导致的宽基线问题。视差问题多产生匹配伪影,宽基线则由于匹配信息较少难以有效配准或造成非重叠区的形状失真。
本文以湖北省十堰市某供销社为试点,依托于科技部重点研发计划项目-绿色宜居村镇技术创新项目(2019YFD1101104),针对传统集中采购交易系统中存在的数据易篡改、数据可信程度低、难以处理大规模用户请求等问题,借助分布式思想、排队论和区块链技术设计开发了集中采购系统交易管理子系统,能够有效帮助农民依靠供销社等平台从网上集中采购生产生活物资,降低生产生活成本。首先,针对单个服务器无法处理大规模请求
互联网的迅速发展给人们生活带来了巨大的便利,但是,网络的过度使用和依赖会造成网络成瘾的风险。网瘾不仅会影响学生的学习生活,甚至会导致抑郁、自杀等更严重的后果。因此,提前发现网络成瘾的高风险人群,并在早期阶段及时进行干预治疗是非常有必要的。现阶段针对网瘾的检测方法大多使用心理学家的调查问卷,但是这种方法具有一定的局限性。目前,计算机领域多数研究使用朴素贝叶斯、逻辑回归等传统机器学习算法进行建模,而这