面向网络安全知识图谱构建的关系抽取技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:panweilu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱目前在许多领域都已经得到了广泛的应用。基于图匹配算法的知识图谱的推理,能够为医疗诊断、舆情发现、事件推理提供良好的理论支持。知识三元组<实体-关系-实体>是知识图谱中知识最基本的构成单位,高效快速地从网络威胁情报自由文本中提取实体之间的关系,是构建网络安全知识图谱的重要基础任务。本文围绕网络安全知识图谱构建的关系抽取算法,进行了深入研究。当前基于神经网络深度学习的远程监督关系抽取算法,在句子特征提取,以及句袋间降噪能力上都还有很大缺陷,这也导致了很多关系抽取算法的性能尚不能满足实际需要。本文基于注意力机制,对现有的关系抽取算法在句子特征提取和句袋降噪上都有了一定的提升。本文主要工作内容和成果如下:(1)传统的关系抽取方法中使用长短时记忆网络和卷积神经网络无法捕获句子中较远距离的特征,对于句子特征的提取不充分,这也影响了后续判定句子中表达的关系的效果。针对这个问题,本文提出了一种基于层次注意力机制的关系抽取神经网络结构模型,使用了自注意力机制来进行单词之间特征计算,使用句子级别的软注意力机制对句子特征进行降维提取,相较于之前的方法,能够更好地捕获句子特征,提升了后续句子关系分类的效果。在公开数据集NYT-10上取得了较好的效果,相比PCNN_ATT算法,在P@100,P@200,P@300指标上分别有了 4.8%,4.9%和2.3%的提升,AUC指标提升了 1.1%。(2)针对远程监督方法在自动标注语料过程中引入了大量错误标注的训练语料的问题,本文提出了一种多关系对齐的句子相似度注意力机制,相比以前的方法,能够更好地捕获句子对关系向量的相似度,更好地在远程监督情况下抽取句子中的关系。在标准数据集上,我们提出的模型相比PCNN_ATT模型,P@100,P@200,P@300,AUC指标分别有了 2.5%,2.4%,2.8%和2%的提升。
其他文献
随着国家治理领域深刻系统革命的推进,政府治理创新成为理论和实践的热点焦点问题。鉴于新公共管理理论的借鉴意义,本文采用理论分析与案例剖析、定量与定性研究相结合的方法
2012年《刑诉法》和《刑诉法解释》颁布后,将电子数据列为单独的证据类型,2016年又颁布了《刑事电子数据规定》,这频繁地增设新规范,体现了电子数据的应用越来越广泛,我国立法者对于电子数据相关法律体系建立的愿望也越来越迫切。之所以电子数据证据在我国得到了立法机关和理论界的着重关注,是因为电子数据证据是现代社会信息科学技术发展下的新产物,是之前数千年都不曾有过的新证据类型,对于全世界都是新事物,其相
不动产登记是登记机关根据当事人的申请或根据法律规定,把不动产的自然状况、权利状况及其他依法应登记的事项记载于不动产登记簿并加以公示的行为。我国建立不动产统一登记制度,不仅可以维护不动产交易的安全,而且也是保护不动产权利人财产权益的重要举措。在不动产登记中,审查是最核心的环节。目前,我国关于不动产登记机关对登记材料进行审查时,应履行何种审查标准的问题,以及法院应怎样合理审查不动产登记机关登记行为的合
电子信息领域中电子测量是非常重要的一部分,电子信息业的快速发展肯定也离不开电子测量的支持。阻抗测量是电子测量中很重要的一部分,可靠的阻抗测量方法对提高阻抗测量的精
随着近年来中国援外培训项目的快速发展,对应的培训班课堂口译需求也急剧增加。报告人于2019年9月3日至23日在湖南省商务厅承办的“发展中国家青年创业研修班”中担任培训课
研究目的:了解北京市医养结合服务开展现状,掌握医养结合机构内入住老年人的服务需求与满意度、机构服务供给情况,分析服务供需差距,探索不断缩小服务供需差距的政策及实践建议。研究内容:一是从基本养老、医疗、护理、康复四大服务49项具体服务项目了解医养结合机构入住老年人的服务需求与满意度;二是从以上服务项目了解医养结合机构供给服务内容,服务人员一定周期内的服务人数及时间;三是分析服务供需差距;四是提出针对
水面舰船作为各国在海洋领域捍卫主权和对敌作战的主要军事力量,需要应对来自空中打击和水下武器袭击的威胁。因此,对舰船结构防护性能的要求不断提高,开展新式防护结构的设计应用已成为提升舰船生命力和结构安全性的重要途径。而国内在钢质夹层板舰船结构方面的研究还处于预研阶段,离实船应用还有一定的距离。要成功实现实船设计应用,必须开展全面系统的研究工作,充分掌握夹层板结构的力学性能、功能特点和防护性能,突破加工
1986年,法国语言学家Dan Sperber和英国语言学家Deirdre Wilson提出了关联理论。关联理论开始主要运用于语言学领域,后来Ernest-August Gutt在他的博士毕业论文中提出了关联理论可以解释翻译研究。本文的研究载体《朝花夕拾》是鲁迅的代表作之一,其中每篇散文中都有大量带有民族文化色彩的词语。论文从关联理论的角度对《朝花夕拾》中的文化负载词的翻译进行了研究,主要从原著作
研究目的了解世界卫生组织在华合作中心(World Health Organization Collaborating Centersin China,以下简称“WHO在华合作中心”)的现状及其参与“一带一路”卫生领域合作的现状,分析其内外部影响因素,针对存在的问题和挑战提出政策建议与措施,为促进WHO在华合作中心参与“一带一路”卫生领域合作,更好发挥作用提供政策建议。研究内容1.WHO在华合作中心
本文首先从生理学基础上分析驾驶员工作负荷和疲劳产生的原因及行为反应,重点以心率变异性这一生理指标分析工作负荷和疲劳的影响关系。从人机工程学的角度出发,分析了驾驶员