面向高速铁路道岔故障维修领域的知识图谱研究与应用

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:jeffery2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高速铁路道岔作为高速列车运营过程中的关键地面信号设备,在高速列车实际运行的过程中,其一旦发生故障会对高速铁路运行的效率和安全产生极大影响。因此,高速铁路道岔的故障维修需要充分发挥技术优势,依托大数据研究高速铁路道岔故障维修方法,辅助高速铁路道岔维护人员进行故障维修,以提高维修效率。高速铁路多年来的运营积累,产生了大量以自然语言方式记录的高速铁路道岔故障文本数据。但当前针对道岔故障维修领域非结构化文本数据的研究,未能充分挖掘出数据中蕴含着丰富的故障知识,仅仅是根据故障诊断结果进行粗略定位,并不能表示出道岔故障时各要素之间的复杂联系。为解决上述问题,本文将知识图谱技术应用至道岔故障维修领域,以高速铁路道岔故障文本数据集为基础,通过知识图谱技术挖掘出道岔故障各要素之间的内部联系,提高维修效率。论文的主要研究内容如下:(1)构建高速铁路道岔故障实体识别语料库。在命名实体识别的初期,需要具有标注好的数据集,但当前高速道岔故障维修领域并没有公开的标注好的数据集,因此本文首要任务就是构建高速铁路道岔故障语料库。首先定义了8种故障实体类型,后续采用“精灵标注助手”软件对高速道岔故障数据集进行文本序列标注,最后将数据处理成实体识别模型允许输入的BIO格式,从而实现高速铁路道岔故障实体识别语料库的构建。(2)建立高速铁路道岔故障维修领域实体识别模型。利用构建完成的高速铁路道岔故障语料库作为实验数据集,建立BERT-Bi LSTM-CRF命名实体识别模型,模型首先通过基于Transformer的预训练语言模型(Bi-directional Encoder Representations from Transformers,BERT)获取上下文语义信息的高质量词向量表示,其次将BERT获取到的词向量输入至双向长短时记忆神经网络(Bi-direction Long Short Term Memory,Bi LSTM),从而学习上下文语义特征,并为各类标签打分,最后将得分标签序列通过条件随机场(Conditional Random Field,CRF)模型增加约束,输出最优标签序列。通过实验分析,本文建立的实体识别模型的精确率、召回率、F1值分别达到93.41%、92.93%和93.17%。并且通过对比实验显示,本文模型在以上三种指标上均优于其他实体识别模型。(3)提出基于规则的高铁道岔故障实体关系抽取方法。为提升领域知识图谱的质量,采用基于规则的关系抽取方法,在道岔维修领域专家的指导下,根据故障数据集的特点制定关系抽取的规则模板,最后再请领域内的不同专家按照制定的规则利用置信度打分的方式进行实体间的关系判断。该方法虽然是人工进行关系抽取,但是抽取规则以及关系判断均由领域专家指导,抽取的关系正确性高,能显著提高知识图谱知识质量。(4)构建高速铁路道岔故障维修领域知识图谱。构建的领域知识图谱分为命名实体识别、关系抽取、知识融合和知识存储四个步骤,在知识融合部分,运用了知识融合的关键技术——实体对齐,利用基于文本相似度与语义相似度算法分别实现了结构相似的同义故障实体与结构相似但语义不同的故障实体的对齐。根据实体识别、关系抽取以及知识融合得到三元组数据结果,构建高速铁路道岔故障维修领域知识图谱,利用Neo4j图数据库实现知识储存和图谱可视化呈现。最后设计基于高速铁路道岔故障维修领域知识图谱的自动问答系统。该系统基于Fast API的web框架下开发,实现了问题解析功能、查询语句生成功能、数据库连接功能、答案转化功能、界面显示功能。用户可以使用此系统完成故障类型的识别、找到故障间的内在联系和隐含知识、提供维修措施的建议。系统有效的辅助了工作人员对高铁道岔故障的维护,推动现场工作更加高效地运转。
其他文献
目的 探讨有氧联合抗阻运动干预对前列腺癌晚期化疗患者癌因性疲乏的影响。方法 随机抽取2021年1月至2022年12月在该院接受前列腺癌化疗的患者90例,将其分为对照组和观察组,每组45例,采用双盲法进行研究。对照组行常规护理干预,观察组行有氧联合抗阻运动护理干预。观察比较两组患者癌因性疲乏、睡眠状况及生活质量的变化。结果 经干预后,观察组在癌因性疲乏量表总分及各维度评分方面均显著优于对照组,差异均
期刊
<正>高分辨率遥感影像目标检测作为高分对地观测系统中影像信息自动提取及分析理解的重要内容,对高分对地观测系统应用价值的发挥具有重要影响。卷积神经网络作为最热门的深度学习模型,由于其可以根据海量数据和标注自行进行有效图像特征提取和学习,在训练数据充足的情况下,模型具有良好的泛化能力,能够在复杂多变的条件下依然保持良好的稳健性和普适性。
期刊
传统场景分类模型不能轻量高效地完成遥感图像中多尺度的关键特征提取,深度学习方法普遍存在计算量大、收敛速度慢等缺点。针对以上问题,本文充分利用CNN结构和Transformer结构对不同尺度特征的提取能力,提出了一种全局-局部特征提取模块(global and local features fused block, GLFF),并基于此模块设计了一个轻量级遥感图像场景分类模型(GLFFNet),该模
期刊
利用深度神经网络进行遥感影像语义分割是遥感智能解译的一个重要内容,在城市规划、灾害评估及农业生产等领域具有十分重要的作用。高分辨率遥感影像具有背景复杂、尺度多样及形状不规则等特点,使用自然场景语义分割方法处理遥感图像往往存在分割精度低的问题。针对上述情况,本文在U-Net模型基础上,提出了一种多尺度跳跃连接方法来融合不同层次的语义特征,获取准确的分割边界与位置信息;引入注意力机制和金字塔池化解决复
期刊
<正>小学阶段,思政教育对学生成长和发展的意义重大,因此,小学数学教师要重视课程思政。钟启泉教授曾说:“教学的教育性是内在隐含的,无须从外部渗透。”这很好地指向了数学课程思政的内生性。具体地说,就是要从数学学科本质有机生成思政教育元素,深入挖掘数学学科的育人元素,以特有方式落实小学数学课程思政,让学生能够抓住抽象与具体、对立与统一、量变与质变等辩证关系来看待外部世界,让学生发展数学思维和理性精神,
期刊
目的 探讨超高度近视患者行后巩膜加固术后眼底形态的变化。方法 选取2016年5月至2017年8月南昌市第一医院眼科医院收治的行后巩膜加固术的超高度近视患者11例21眼作为研究对象。术后随访24~39个月,检测并记录患者最佳矫正视力(BCVA)、眼轴长度、视盘面积、Bruch膜孔面积、γ区长度、中心凹距视盘颞侧边缘距离、视网膜厚度、脉络膜厚度以及近视性视网膜病变(血管旁病变、视网膜劈裂)情况等。结果
期刊
针对高分遥感影像用于滑坡智能识别缺少高清训练集的问题,在组建高清滑坡训练集过程中,为充分利用低分辨率滑坡影像,本文采用基于增强型生成对抗网络模型(ESRGAN)实现了低分辨率滑坡影像集超分辨率重建。ESRGAN模型在SRGAN模型基础上,通过移除批归一化层、加入多级残差网络与残差缩放系数,提升了生成器的特征提取性能与稳定性,并采用迁移学习方法,基于毕节滑坡影像集与云南南景高速公路滑坡影像集进行试验
期刊
随着高比例风电、光伏等清洁能源接入电力系统,为避免清洁能源波动性危害电网薄弱环节而造成严重事故,有必要对风电场接入前后电网脆弱性进行分析。首先,建立风电场接入系统模型,分析风电的出力特性。其次在传统电网脆弱性分析方法上增加环境因素对电力系统脆弱性的影响,通过层次分析法-熵权法,确定不同指标所占全权重并建立电网脆弱性量化分析模型。最后采取典型IEEE 39节点进行仿真计算,分析不同风速和不同接入位置
期刊
科技馆展品作为科技馆信息的主要载体,强调科学性与知识性、趣味性和娱乐性。目前科技馆展品多为单一知识内容的传播,是否可以实现展项内容和表现手段并存传播的目的。此外,莫尔条纹动画作为视觉现象中的一种特殊的形式,其趣味、奇特、矛盾等特点在产品艺术设计领域应用广泛,但在科技馆展品设计中的应用却较少且存在局限性。如果能在展品设计中科学合理地运用这一原理,则有利于调动受众的兴趣、增强受众的好奇心理、提高受众获
期刊
目的 基于因果森林对三阴性乳腺癌(triple negative breast cancer, TNBC)患者术后放疗的疗效进行个性化评估,为个体化治疗提供决策依据。方法 基于美国SEER数据库收集TNBC患者资料,根据患者全乳切除术后是否接受放疗分为两组,采用倾向性评分匹配法得到拟随机化数据;基于因果森林探索术后放疗的个性化疗效,并识别异质性亚组。结果 大约84.88%患者能够从术后放疗中获益,
期刊