基于文本挖掘的城市轨道交通CBTC系统的故障诊断方法研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:laokai_zhangzichen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着城市化进程的加快,城市轨道交通作为一种方便快捷的出行方式,对居民的日常生活也越来越重要,CBTC系统作为城市轨道交通的重要控制系统,是保障列车安全运营的关键,因此在系统故障时能够及时定位故障发生的位置对于恢复列车运营有重要意义。现场所使用的故障诊断方式通常是由专业的检修人员依据故障发生的现象,分别对各个设备进行故障排查来确定故障原因的,该方式主要依赖于检修人员的经验,自动化程度较低。而在检修过程中产生的维保数据中含有大量与故障相关的信息,目前,该数据的利用率较低,因此本文主要以CBTC系统检修过程中产生的维保数据为研究对象,通过对该数据进行文本挖掘以实现CBTC系统的故障诊断。本文通过对CBTC系统的维保数据进行分析,采用BERT模型对数据进行文本的向量化表示,并通过Bi-GRU-ATT网络实现语义增强,通过PSO算法对模型进行超参调优,最后提出一种新型的诊断架构,来实现故障的诊断。研究内容主要包括以下几个方面:首先,通过分析目标数据,结合数据特点与系统结构进行一级故障与二级故障的划分,并建立两级故障之间的层级关系,并采用BERT模型对维保数据进行语义提取和文本向量的生成。并将其与Word2vec-TF-IDF生成的向量表示进行实验对比,来验证BERT在语义提取以及文本向量化方面的有效性。其次,由于损失函数对于引导模型训练方向有着重要作用,因此针对数据分布不平衡的特点,受图像处理中用于解决数据不平衡问题所采用的Focal Loss损失函数的启发,将Focal Loss作为本文提出的模型的损失函数;在下游任务网络结构选择的过程中,通过实验对比数据在四种不同隐藏层结构中的表现,选择合适的网络结构,然后通过PSO算法对模型进行调优。再次,提出一种并行诊断架构,通过纠错策略对不满足要求的诊断结果在决策层进行融合。实验证明最终的诊断结果相较于二级诊断结果平均提高了7到2个百分点,该方法有效的降低了模型的误诊率。最后,以上述算法为基础,通过实验对模型的有效性进行验证并进行诊断平台的搭建,实验结果显示,对于一级故障而言,准确率可达90.2%,对于二级故障而言准确率可达80.1%。全文共有图49幅,表11个,参考文献55篇。
其他文献
工商行政管理是我国社会经济发展到一定历史阶段的产物,是一个历史范畴。工商行政管理部门在从事行政活动时要耗费一定的资源,如何以较小的资源耗费达到最优化的行政目的,是
随着全世界范围内空气污染控制工作的开展,颗粒物污染治理卓有成效。但由于能源结构优化及人们生活方式的改变,颗粒物的来源趋于复杂,为了更好的控制颗粒物来源,需要开展精细
随着基建投入的加大,相应水泥的用量也在不断的增多,为了缓解水泥用量的压力和日益造成的环境污染问题,寻求矿物掺合料替代水泥是非常迫切的。胶凝材料或混凝土常采用矿物掺合料来改善其性能,矿物掺合料可以降低水泥基材料的水泥用量,改善和易性,降低水化温升,提高强度等诸多优势。常用的掺合料包括粉煤灰、矿渣和石灰石粉等材料。粉煤灰和矿渣具有水化活性,常用作混凝土的掺合料,但其含量必须通过试验确定,磨细石灰石粉具
随着互联网和移动通讯的不断发展,尤其是以阿里巴巴和腾讯为代表的新兴互联网企业,逐渐渗入到传统行业的经营领域之中,使得各行各业都在面临新的变革机遇与挑战,传统银行业也不例外。随着余额宝、众筹、人人贷等相关互联网金融产品的不断出现,不断打破传统的行业壁垒,不仅对传统银行的目标市场造成极大冲击,而且不断创造和衍生出更多的互联网金融产品与服务类型,同时也对广大消费者的消费观念和理财观念产生了巨大的影响。在
我国3~66kV中压配电网多采用小电流接地方式,单相接地故障约占总故障类型的65%以上,若不能及时地排除故障,将严重影响系统的供电可靠性,加之单相接地的故障特征容易受到接地电阻、现场噪声以及不稳定电弧等因素的影响,从而给准确判定故障线路带来诸多困难。为此,本文以小电流接地系统单相接地故障选线为研究对象,就故障特征提取、故障线路判定以及选线准确率提高等问题展开研究。本文对小电流接地系统稳态及暂态故障
为解决主流非易失性存储器-闪存(Flash)的微缩极限问题,近几年涌现出一系列新型非易失性存储器:磁存储器、铁电存储器、相变存储器和阻变存储器;其中阻变存储器(resistive rando
在分子动力学模拟过程中,多采用周期性边界条件以消除边界效应,为了计算简单,大多数模拟都依靠长方体模拟盒来进行。在模拟中以长方体作模拟盒,使用周期性边界条件会使模拟结果中得到的扩散系数小于真实实验中的扩散系数。因此模拟的结果不能直接和真实实验作对比,而需要加入修正系数对模拟结果作出修正。本文以流体扩散理论作为研究的出发点,理论给出几种模拟盒下的修正公式。借助分子动力学方法,在各种不同的条件下,对氩原
随着大数据时代个人信息产业的蓬勃发展,作为重要商业资源之一的个人信息的财产价值不断地被开发和利用,个人信息的财产属性越来越凸显。然而,个人信息资源的不当利用甚至是
鲁迅的小说开创了中国小说的历史新纪元,作品极具隐喻特色,作品中的“路”含义丰富,隐喻特征明显,是理解鲁迅小说的重要线索之一。本文试图结合概念整合理论,以鲁迅小说中杨
随着科技的日益创新,尤其在党中央提出“一带一路”倡议之后,科技翻译在全球化进程中占据着举足轻重的地位。科技类文本信息密集,逻辑性强,语言客观,结构凝练,以名词化结构、被动句等为突出特点。以往对名词化结构的传统分类,常见动词派生型、形容词派生型和零派生型三类,或是简单名词化结构、复杂名词化结构和动词或形容词派生而来的三类。本文中笔者主要将名词化结构分为转类型和转级型,前者主要体现在词汇层面,包括词缀