论文部分内容阅读
RBC(Raidio Block Center,无线闭塞中心)是CTCS-3级列控系统的地面设备,是保证列车高速安全运行的核心设备之一。其发生故障可能影响数百万人的出行安全,而现场工作中RBC系统的故障原因分析及故障类型诊断主要由人工完成,不具备科学性的判定过程。目前,利用人工智能方法进行RBC系统故障诊断的相关研究仍较少。因此,本文以列控RBC故障系统追踪记录为初始数据样本,利用短文本处理技术、分布式特征表示和特征词权重计算实现故障文本向量化表示,生成机器可识别的结构化数据;搭建基于DBN(Deep belief network,深度信念网络)和BP(Back Propagation,反向传播)神经网络的故障诊断模型,使用有标签的故障数据训练模型,拟合故障现象与故障类型的映射关系,从而实现列控RBC系统的智能故障诊断。本文主要研究内容包括:(1)短文本处理。列控RBC系统故障记录是由几个词到几十个词的短文本组成,为了挖掘有效信息,利用结巴分词工具对故障文本做分词处理,去除时间、地点、列车号等无关信息,生成能够表征故障文本信息的特征词集合。做分词处理时,由于没有铁路方面的专业词库,为了能得到最佳的特征词集合,故需建立自定义词库。(2)故障特征分布式表示。独热表示和分布式表示是两种最主要的词向量表示方式。由于后者能克服前者特征表示稀疏、容易造成词汇鸿沟等缺点,故本文采用分布式表示方式表征特征词的语义信息。(3)构造故障文本向量。通过比较发现,基于类间集中度和类内分散度的期望交叉熵既能根据所含类别信息的多少给特征词分配权重,又满足在计算权重时特征词在类间距离最大、类内距离最小的目的。因此,本文采用基于类间集中度和类内分散度的期望交叉熵计算特征权重,并分配给相对应的特征词向量,进而构造故障文本向量。(4)搭建故障诊断模型。针对浅层机器学习无法学习数据深层次的特征、削弱了机器学习进行智能诊断的能力等问题,本文采用DBN-BP构建故障诊断模型,利用DBN强大的特征学习能力,提高BP网络的故障诊断性能。以某站列控RBC系统故障文本数据为训练样本,仿真结果表明,本文设计的故障诊断模型的平均正确率达到90.68%,性能稳定。说明本文提出的故障诊断方法能够有效利用故障文本信息,实现列控RBC系统智能故障诊断,降低对人工经验的依赖性。