三元组半自动标注系统的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:shengbangcl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,知识图谱技术发展迅速,知识图谱价值不断地被发掘,各类领域知识图谱也迅速建设起来。三元组在知识图谱的构建和应用中起到了关键作用,它们连接了不同的实体和概念,形成了丰富的知识关系网络。由于领域知识图谱的构建要求与通用知识图谱存在明显的不同,所以在领域三元组标注的过程中面临诸多挑战:(1)领域三元组需要从大量自然语言数据中抽取,需要进行大量的人工标注工作。(2)领域知识图谱对三元组数据的质量要求非常高。(3)领域三元组有特定的实体和关系类型,需要训练面向特定领域的知识抽取模型来进行三元组的抽取。针对上述问题,本文设计了一种基于联合抽取的三元组数据预标注方法和一种基于ALBERT的三元组数据标注方法,并构建了一个三元组半自动化标注系统。具体研究内容如下:(1)本文设计一种基于联合抽取的三元组数据预标注方法,提出了基于层叠指针网络与多头选择机制的联合抽取模型。通过基于层叠指针网络的实体抽取方法解决实体嵌套问题,通过基于多头选择机制的关系抽取方法解决关系重叠问题。(2)本文设计一种基于ALBERT的三元组数据标注方法,该方法通过多次循环训练模型,提高预标注模型的准确率。该方法使用轻量级的实体关系联合抽取模型,在提高模型训练效率的同时,还通过扩大序列标注范围,解决关系重叠问题,提高模型抽取的准确率。(3)本文设计并构建三元组半自动标注系统,通过引入数据智能预标,提高人工标注的效率。系统设计合适的领域管理、任务管理、数据统计、题目分发等功能,为面向领域的知识图谱的标注和构建提供一个高效便捷的平台。通过对比实验和系统测试,本文提出的基于联合抽取的三元组数据预标注方法中的预标注效果明显优于其他联合抽取模型;本文提出基于ALBERT的三元组数据标注方法可以在明显加快模型训练效率的同时,保证较高的预标注效果;系统功能完整,具有较高的可用性和鲁棒性。
其他文献
乳酸菌和酵母菌广泛用于谷物、果蔬、豆制品、乳制品等食品的发酵,在食品工业中具有重要的地位。乳酸菌和酵母菌不仅可以分别用于食品的发酵,还可以组合使用对食品进行联合发酵。该文对不同乳酸菌与酵母菌的组合方式、相互作用,及其对食品品质的影响进行了分析和总结,表明乳酸菌和酵母菌联合发酵对食品的感官特征、贮藏时间等品质具有明显影响,对改善食品品质具有重要意义。该研究旨在为乳酸菌与酵母菌联合发酵改善食品品质中的
期刊
机器学习在分类任务中已经取得了重大突破,但建立良好的机器学习框架往往需要大量标注数据的支持。随着相关法律法规的发布和人们隐私意识的觉醒,直接的数据共享变得愈发困难,多方协作学习是解决该问题的关键技术之一,其中基于数据标注的多方协作学习可以在不共享原始数据的情况下转移本地知识,降低了用户隐私泄露的风险。然而,在数据协作标注中,参与方作为数据标注的主体是不规则的,难免会引入噪声影响标签的质量。目前,为
学位
教学评价是教学过程中不可或缺的一部分,它可以帮助我们了解学生在学习过程中的表现,并且能够激励他们更积极地学习。然而,在传统的教学模式中,教师们往往缺乏对教学评价的重视,并且使用的评价方式也不够科学。他们更多地依靠学生的成绩来评价,缺乏客观性。随着新课改的推进,对教师的教学评价也提出了更高的要求,因此,教师们需要综合考虑学生的学习过程,建立"教-学-评"一体化的模式,以促进学生的全面发展和健康成长。
会议
<正>镇远县把发展壮大村级集体经济作为推进乡村全面振兴的重要途径,通过组织引领、人才培育、机制创新,推动村级集体经济提质增效。3月的镇远县青溪镇鸡鸣村,玉米、水稻下种育苗全面铺开。挂刀坪蔬菜种植基地大棚里,茼蒿、豌豆尖等时令蔬菜郁郁葱葱,长势喜人,村民背着背篓、提着篮子忙碌采摘。
期刊
对多功能相控阵雷达工作模式准确识别可为电子对抗决策提供依据,具有重要研究意义。现有工作模式识别方法主要基于已知标签的训练集,而实际中先验信息匮乏,数据标签难以获知,极大影响了工作模式识别性能。为此,提出了一种在少量先验信息辅助下基于半监督学习聚类实现未知数据标注的工作模式识别方法。首先根据聚类算法的内部评价指标和外部评价指标对比分析AP聚类(affinity propagation cluster
期刊
在"双减"政策背景的影响下,"家园共育"变得尤为重要。为了更好的实现"家园共育",幼儿园需要重视家长学校的建设。但目前在家长学校工作中仍然存在一些问题。本文结合幼儿园中的实际情况分析家长学校工作中存在的问题,并且结合本幼儿园已开展的工作总结出家长学校建设与运行的一些思路与策略。从而推进"家园共育",形成教育合力,促进幼儿的全面发展。
会议
肠道中存在着大量的有益微生物,但其中真菌占比较少。酵母菌类属真菌,被广泛用于食品发酵及酿造等领域,具有长久的安全食用史。近年来,酵母作为益生菌的诸多特性逐渐显现并且被广泛开发和应用。与发酵功能相比,酵母菌的益生功能很少被研究。本文列举了不同来源的酵母菌,并对其六种益生特性进行评述,旨在为探究酵母菌益生性并发挥其有益效用提供新思路。
期刊
桥梁结构的健康监测和损伤识别一直是桥梁工程领域的研究热点。近年来,越来越多大跨度桥梁安装了不同规模的结构健康监测系统,对桥梁的运营状态进行实时监测。结构健康监测系统采集了海量的监测数据,如何高效利用这些监测数据成为亟待解决的问题。本文采用福建琅岐闽江斜拉桥超过1年的监测数据,研究了基于迁移学习和各种深度学习算法的温度-主梁应变、温度-主梁挠度和温度-伸缩缝位移等多源监测数据的映射模型构建方法。本文
学位
传统发酵食品历史悠久、风味独特并具有一定地域特色,深受当地居民喜爱,但在进一步推广中却面临产品质量不稳定、缺乏安全保障等问题。乳酸菌和酵母菌广泛存在于各类传统发酵食品中,并在发酵过程中起重要作用,因此,解析二者间的互作机制能为传统发酵食品发展提供理论支撑。目前已发现乳酸菌和酵母菌的互作机制可分为代谢产物互补、影响细胞生长、群体感应现象3大类。该文综述了乳酸菌与酵母菌混菌发酵两者间相互作用的研究方法
期刊
数控刀架是影响数控车床和车削中心可靠性水平的最主要的关键功能部件,应用故障树模型进行故障分析和故障溯源是提高产品可靠性和维修性的主要技术手段。由于数控刀架结构复杂、故障模式多样,特别是一些主要故障模式的故障状态除二态之外还呈现多状态特性和动态特性(以下统称为多态性),同时存在对数控刀架故障树定量分析的认知偏差、维修信息或故障数据不足、性能水平及参数等方面的不确定性。因此,传统的二态故障树方法难以完
学位