基于短文本处理的列控RBC系统故障诊断研究

来源 :兰州交通大学 | 被引量 : 2次 | 上传用户:llxww104
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RBC(Raidio Block Center,无线闭塞中心)是CTCS-3级列控系统的地面设备,是保证列车高速安全运行的核心设备之一。其发生故障可能影响数百万人的出行安全,而现场工作中RBC系统的故障原因分析及故障类型诊断主要由人工完成,不具备科学性的判定过程。目前,利用人工智能方法进行RBC系统故障诊断的相关研究仍较少。因此,本文以列控RBC故障系统追踪记录为初始数据样本,利用短文本处理技术、分布式特征表示和特征词权重计算实现故障文本向量化表示,生成机器可识别的结构化数据;搭建基于DBN(Deep belief network,深度信念网络)和BP(Back Propagation,反向传播)神经网络的故障诊断模型,使用有标签的故障数据训练模型,拟合故障现象与故障类型的映射关系,从而实现列控RBC系统的智能故障诊断。本文主要研究内容包括:(1)短文本处理。列控RBC系统故障记录是由几个词到几十个词的短文本组成,为了挖掘有效信息,利用结巴分词工具对故障文本做分词处理,去除时间、地点、列车号等无关信息,生成能够表征故障文本信息的特征词集合。做分词处理时,由于没有铁路方面的专业词库,为了能得到最佳的特征词集合,故需建立自定义词库。(2)故障特征分布式表示。独热表示和分布式表示是两种最主要的词向量表示方式。由于后者能克服前者特征表示稀疏、容易造成词汇鸿沟等缺点,故本文采用分布式表示方式表征特征词的语义信息。(3)构造故障文本向量。通过比较发现,基于类间集中度和类内分散度的期望交叉熵既能根据所含类别信息的多少给特征词分配权重,又满足在计算权重时特征词在类间距离最大、类内距离最小的目的。因此,本文采用基于类间集中度和类内分散度的期望交叉熵计算特征权重,并分配给相对应的特征词向量,进而构造故障文本向量。(4)搭建故障诊断模型。针对浅层机器学习无法学习数据深层次的特征、削弱了机器学习进行智能诊断的能力等问题,本文采用DBN-BP构建故障诊断模型,利用DBN强大的特征学习能力,提高BP网络的故障诊断性能。以某站列控RBC系统故障文本数据为训练样本,仿真结果表明,本文设计的故障诊断模型的平均正确率达到90.68%,性能稳定。说明本文提出的故障诊断方法能够有效利用故障文本信息,实现列控RBC系统智能故障诊断,降低对人工经验的依赖性。
其他文献
目前变电站无人值守是变电站最先进的管理模式,微机综合自动化监控系统是实现变电站无人值守的必经途径。在深入研究微机综合自动化监控系统发展现状的基础上,以云南省都龙矿
人们可以通过调整自己的世界观和价值观,来调整实践活动的方向与方式,从而改变社会发展和文明演进的路向与前景。中国目前正处于以市场化、工业化和现代化为发展目标的社会转型
[なぃて 、なくて]都是接续助词,都是用来否定前面的事情并接下来叙述后面的事情的,但是用法却不尽相同。
普利沙星是新口服的氟喹诺酮类抗菌药.本品为前体药,其活性代谢产物通过阻碍DNA拓扑异构酶使细菌DNA无法形成超螺旋,导致细菌细胞无法分裂繁殖.临床上用于治疗各种敏感致病菌
目的:探讨氟喹诺酮类抗菌药后效应及其合理应用。方法:参考有关论述氟喹诺酮类抗菌药后效应、不良反应及耐药性的文献。结果与结论:了解氟喹诺酮类抗菌药后效应,可为临床合理用药
诱发脑电波形的动态(单次)提取是生物医学信号处理领域的前沿课题,有很强的实用价值和理论意义。本文着重归纳了近几年人们在诱发脑电动态提取工作中所采用的主要方法的基本原理
目的 比较美国G5震动排痰机排痰法,与超声雾化吸入加手工叩背法的临床疗效。方法 将128例呼吸道分泌物增多,痰液黏稠,不易咯出,喘憋严重,只有借助吸痰才能解决痰液潴留问题的患儿
今年7月,中国再次成为日内瓦经济外交圈的关注焦点,因为世贸组织对中国进行了第七次贸易政策审议。这次审议是中共十九大后中国第一次接受世贸组织成员对经贸政策的'全面
<正>金融是现代经济的核心,金融活,经济活;金融稳,经济稳。防范化解系统性金融风险,事关国家安全、发展全局、人民财产安全。2019年,全国人大常委会就防范化解系统性金融风险
近年来,随着我国综合国力和经济的迅速提升,各种新兴产业也开始崛起和发展,其中基础结构的大体积混凝土施工也开始在国内兴起。但由于我国基础结构的大体积混凝土施工行业起