基于学术知识图谱的学位论文挖掘技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:jessiexsu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的飞速发展,论文作为科技成果的主要展现形式也已经累计到了一个惊人的数量,抽取论文相关信息构建学术知识图谱是当前充分地挖掘论文学术价值的主要方法之一。目前主流的学术知识图谱(如全球最大的开放学术知识图谱OAG、东北大学的Tech KG和上海交通大学的Ace KG)都是基于期刊和会议论文构建的,没有利用信息更丰富、学术价值更高的学位论文。本文就如何基于学位论文构建学术知识图谱并挖掘学位论文价值开展了深入的研究,其主要的工作和贡献如下:(1)基于学位论文的知识图谱构建技术研究针对当前主流学术知识图谱人物关系不够丰富的问题,本文基于190,912篇全军院校的学位论文数据,构建学位论文知识图谱。针对跨学科、跨院校学位论文格式不统一,数据难以融合管理的问题,设计了一种融合多规则多模型的信息抽取框架,从19万篇全军院校公开发表的学位论文中,抽取350万余个三元组,利用共指消解技术融合相关实体并将其存储在Neo4j图数据库中。本文构建了由1,733,831个节点、4,772,865条属性和3,525,955条关系组成的学术知识图谱。(2)基于师门关系的研究团队发现算法研究针对基于合作关系难以发现联系紧密的科研团队的问题,本文使用BILSTM-CRF模型从学位论文致谢部分抽取师门关系,并提出一种基于师门关系改进的鲁汶算法,提升了鲁汶算法的运行效率。本文分别在335、1599、19526个节点的不同规模的数据中进行对比,实验表明该算法能够显著提升挖掘出的研究团队的可靠性。(3)基于知识图谱的研究团队实力分析技术研究针对团队学术成果质量参差不齐、研究团队实力分析困难的问题,本文将研究团队实力分析当作是一个线性回归问题,提出了一种多维度融合的研究团队实力分析方法,综合考虑了多个不同维度对研究团队实力的影响。邀请10位志愿者结合个人对研究团队研究成果的评估,为30个研究团队打一个百分制的分数,用于模型的训练和测试,实验表明该方法能够有效评估团队实力。
其他文献
随着互联网的高速发展,网络服务和应用已经融入到社会的各个方面。然而网络入侵与破坏事件层出不穷,网络安全不仅是每一位网络用户关心的话题,甚至已经成为国家战略的新型力量支撑。面对日益严峻的网络环境,网络入侵检测技术备受关注。入侵检测的一个重要方法是识别攻击代码,Shellcode就是其中主要的一种,常被用于在漏洞利用中执行恶意功能,缓冲区溢出漏洞则是典型场景之一。到目前为止,已有多种用于检测Shell
你喜欢吃小龙虾吗?在中国,小龙虾称得上是美食界的"明星大咖"。十三香、麻辣、蒜蓉、清蒸、油焖,每一种口味都深得"吃货"的心。《中国小龙虾产业发展报告(2021)》指出,2020年我国小龙虾产业总产值超过3400亿元。但是你可能不知道,小龙虾有着两副面孔,除了是餐桌上的美食,它更是一种破坏性极强的外来入侵物种,鱼类、水生植物等都深受其害。而且,小龙虾打洞,给水库、湖泊、堤坝等也带来不小的风险。
期刊
地理空间信息的三维可视化一直是地理信息系统与应用的重要内容,近年来快速发展的倾斜摄影测量技术为获取大范围高精度地物实景三维模型提供了有效的手段。然而,倾斜摄影测量技术形成的三维模型本质上属于数字表面模型。通过无人机等航空平台生成的倾斜摄影测量数据只能建立城市建筑物外部的三维表面,而无法描述其内部的模型细节,导致了三维地理信息系统对于建筑物内部信息描述能力的缺失。建筑信息模型(BIM:Buildin
仿真优化的主要目标是优选系统解决方案,同时降低多方案优选过程中总的仿真执行次数,提高求解最优方案的效率。由于实际问题变得越来越复杂及其随机性的影响,仿真优化需要多次独立测试每个方案,才能挑选可信的最优方案,所以仿真优化需要高且不确定的计算能力。云计算为仿真优化提供了经济、高效且灵活的平台。但是当前仿真优化算法大多都是面向单用户任务,且缺乏可以在每个阶段并行执行的足够样本,无法充分利用云计算资源,无
社交网络服务的迅速发展,深刻地影响着人们的日常生活。社交平台中的海量用户构成了一个真实世界的网络映射,但目前对这一网络的很多现象和以及演化规律仍缺乏系统的认识。研究社交网络的演化可以帮助认清网络的形成机制,预测网络连接趋势。本文以社交网络为背景,从链路预测的角度出发,对社交网络的演化问题进行了研究。本文主要贡献如下:(1)从预测准确度、计算时间消耗、预测稳定性三个方面充分对比分析了当前常用的链路方
提高无人作战系统的自主性是无人作战系统发展的一种重要趋势,自主性在军事应用上具有诸多优势。目前,我军对无人装备研究较多,但对无人作战系统自主性方面的研究比较少。与其他军事强国特别是美国相比,无人系统在军事方面的应用研究仍需加强。本文针对军事应用背景下无人作战系统的自主性特性,提出无人作战系统自主性的内涵及其概念模型,分析无人作战系统的自主性,建立相关等级模型及评估方法,研究面向任务的无人作战系统自
近年来,Iaa S(Infrastructure-as-a-Service)云计算平台在为松散耦合的科学应用(如科学工作流)构建灵活、高效和低成本的运行环境方面显示出巨大潜力。一方面,当Iaa S云提供虚拟资源时,用户可以根据特定应用程序的要求定制执行环境;另一方面,与传统的高性能集群相比,用户可以按需租赁各种类型的云资源,在资源配置灵活性上具有更大的优势。此外,Iaa S云平台按使用量计费的模式
万物互联时代,海量数据在网络边缘产生,使得数据传输压力急剧增大。同时,新型应用的实时性、可靠性和隐私保护需求也逐步提高,采用传统集中式云计算,难以满足应用需求。针对该问题,边缘计算提出利用更接近数据产生端的网络节点,提供分布式计算、存储和控制服务,从而减少数据传输量,为用户提供高实时、高可靠和安全的服务。近年来,边缘计算的发展过程提出了诸多挑战。本文围绕边缘计算的资源分配与数据访问两方面进行研究,
由于指纹、虹膜等生物特征设备在笔记本、平板、手机上的日趋普及,以及基于Linux内核的操作系统在市场上的占有率越来越高,其上的生物特征认证系统也就越发重要。然而当前的Linux类操作系统上的生物特征认证方案在用户体验、易用度上都与Windows等商用操作系统存在较大差距。因此构建Linux上成熟完善的生物特征认证系统显得尤为重要。本文针对该问题,进行了深入的研究与方案的设计,设计并实现了一种基于事
论文立足科研项目管理实际要求,针对综合计划部门的实际管理工作中效率低、人工存档出错率高等相关问题,利用软件工程设计的思想,以科研管理信息系统软件的设计与开发为课题研究内容。本文的主要工作和贡献如下:(1)对科研项目管理工作进行了需求分析。通过前期对综合计划部门业务工作的深入调研,充分分析和优化了各个项目管理工作的组成、流程和数据需求等情况,进一步明确了用户需求,对需求分析进行文字描述、绘制了工作流