基于粗糙集和信息熵的BP神经网络故障诊断

来源 :计算机辅助工程 | 被引量 : 0次 | 上传用户:bj4587
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:针对粗糙集只能处理量化数据,容错和推广能力较差的缺点以及BP神经网络的维数灾难问题,提出1种基于信息熵的粗糙集属性离散化方法. 该方法利用粗糙集对属性进行约简,解决BP神经网络的维数灾难问题,并将BP神经网络用于模式分类补偿粗糙集属性约简用于模式分类时的不足. 实例分析表明该方法具有较好的故障诊断效果.
  关键词:粗糙集; 信息熵; 离散化; 神经网络; 故障诊断
  中图分类号:TP212文献标志码:A
  
  Fault diagnosis of BP neural network based on
  rough set and information entropy
  WANG Faxing1, SHEN Yonghong2
  (1. Tongda College, Nanjing Univ. of Post & Telecommunications, Nanjing 210046, China;
  2. School of Mathmatics & Statistics, Tianshui Normal Univ., Tianshui Gansu 741000, China)
  Abstract: Rough set can only process quantization data, and the ability of fault-tolerant and generalization is weak, meanwhile, BP neural network has the dimension disaster problem. So a rough set attribute discretization method based on information entropy is proposed. The attribute is reduced to solve the dimension disaster problem of BP neural network. BP neural network is used to deal with the pattern classification to make up for the shortcoming brought by attribute reduction. The example result shows that the method has better performance for fault diagnosis.
  Key words: rough set; information entropy; discretization; neural network; fault diagnosis
  收稿日期:2009-05-08修回日期:2009-08-28
  作者简介: 王发兴(1981—),男,甘肃武威人,讲师,硕士,研究方向为小波分析和计算机仿真等,(E-mail)fxwangcaptain@126.com
  
  0引言
  
  粗糙集理论是PAWLAK教授于20世纪80年代提出的1种新的处理模糊和不确定性知识的数学工具,具有无须提供除问题所需处理的数据集合之外的任何先验信息,仅根据观测数据删除冗余信息,比较不完整知识的程度——粗糙度、属性间的依赖性和重要性来抽取分类规则等的能力,其主要思想就是在保持系统分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则.目前,粗糙集理论已被广泛应用于机器学习、决策分析、模式识别与数据挖掘、故障诊断等领域.[1]
  粗糙集模式识别的核心思想是首先导出问题的决策或分类规则,然后以此构成识别器对待识样本数据进行识别.当待识样本数据满足分类规则的条件时都会得到准确的识别结果,但当条件不满足时往往会有识别错误或不能识别的现象发生,其容错能力和推广能力相对较弱.BP神经网络是神经网络中最具代表性的1种,具有较强的模式分类能力,且容错能力和推广能力相对较好.但当网络维数较大或输入样本较多时,网络训练时间过于冗长.鉴于以上分析,在文献[1]中给出基于信息熵的属性离散化方法的基础上,本文克服粗糙集和BP神经网络各自用于模式识别时的缺点,将两者加以结合,从而建立1种基于新的离散化算法的粗糙集和BP神经网络故障诊断识别模型,以期在故障诊断识别中能取得更好的应用效果.
  
  1粗糙集理论和信息熵
  
  1.1粗糙集理论
  1.1.1知识表达系统和决策系统
  定义1在粗糙集理论[2-7]中,知识表达系统被定义为1个四元组S=(U,A,V,f).其中U={x,x2,…,xn}为对象的非空有限集合,也称为论域;A={a1,a2,…,am}为属性的非空有限集合;V为属性值域,V=∪a∈AVa;f:U×A→V为一信息函数,表示对每一a∈A,x∈U,f(x,a)∈Va.当上述知识表达系统中属性A=C∪D,C∩D=Φ,其中C为条件属性集,D为决策属性集时,也称知识表达系统为决策系统.该系统通常采用决策表表达.[2-5]
  1.1.2不可分辨关系
  不可分辨关系是粗糙集理论中的1个重要概念.在决策表中,描述对象的属性是1种不精确信息,这种不精确信息造成对象之间是不可分辨或不分明的,观察这种不可分辨关系的对象正是粗糙集理论研究的出发点.
  定义2S为知识表达系统,若PA,则定义属性集P的不可区分关系ind(P)为:
  ind(P)={(x,y)∈U×U,a∈P,f(x,a)=
  f(y,a)}(1)
  如果(x,y)∈ind(P),则称x和y是P不可分辨的.不可分辨关系实际上是1种等价关系,具有不可分辨关系的对象是属性值完全相同的对象.符号U/P表示不可分辨关系ind(P)在U上导出的划分,称ind(P)中的等价类为P基本类.
  1.1.3粗糙集的下近似、上近似及正域
  定义3令XU,R是U上的1个等价关系.当X为R的某些等价类的并时,称X是R可定义的,否则称X是R不可定义的.称R可定义集为R精确集,称R不可定义集为R粗糙集.粗糙集可以用两个精确集,即粗糙集的下近似和上近似描述.其定义[3-6]如下:R-(X)=∪{YU/R|Y∩X≠Φ}(2)
  R-(X)=∪{YU/R|YX}(3)其中,也称POSR(X)=R-(X)为X的R正域.
  1.1.4属性约简
  在决策表中,不同的条件属性具有不同的重要程度,一些属性可提供丰富的信息,对产生决策起着至关重要的作用,而其他一些属性却似乎可有可无.因此,可以在保证决策表具有正确分类能力的同时,对条件属性进行约简,去掉不必要的冗余信息.这就涉及到对属性约简的问题,其定义[3-4,6-7]如下:
  定义4对于一给定的知识表达系统S=(U,A,V,f),条件属性C的约简是C的1个非空子集P.它满足:(1)a∈P,a都是D不可省略的;(2)POSP(D)=POSC(D),则称P是C的1个约简.
  1.2信息熵
  信息熵可表征信源整体的统计特征,是总体平均不确定性的量度.对于某一特定的信息源,其信息熵就只有1个,不同的信息源,因统计特性不同,其熵也不同.SHANNON定义自信息的数学期望为信息熵,即信息源的平均信息量H(X)=E[-log P(xi)]=-Ni=1P(xi)log P(xi)(4)式中:P(xi)表示事件xi发生的先验概率.
  给定知识表达系统S和U为论域,P为U上的等价关系,令U/P={X1,X2,…,Xn},记P(Xi)=|Xi||U|,则依据式(4),可定义知识P的熵[8]为:H(P)=-ni=1P(Xi)log P(Xi)(5)2BP神经网络结构及BP算法
  2.1BP神经网络结构
  BP神经网络是指具有非线性传递函数神经元构成的、采用误差反向传播算法(BP算法)的前馈网络,在各领域有广泛的应用.[9-10]该网络通常由输入层、隐层(一层或多层)和输出层组成,层与层之间多采用全互联方式,同一层单元之间不存在相互连接,层间的连接权值和节点的阈值通过学习调节.理论上已证明,1个单隐层BP网络可以实现任意维到维的非线性连续映射,而且各节点均采用Sigmoid函数时,1个隐含层就足以实现任意判别分类问题.[11]常见的3层BP网络模型结构见图1.图 13层BP神经网络模型
  2.2BP算法
  BP算法是建立在梯度下降法基础上的适合于多层神经元网络的1种网络学习算法,主要思想是将学习过程分为2个阶段[8]:第1阶段(正向传播过程),给出输入信息通过输入层经隐含层逐层处理并计算每个单元的实际输出值;第2阶段(反向过程),若在输出层未能得到期望的输出值,则逐层递归地计算实际输出与期望输出之差值(即误差),以便根据此差调节权值,就是可对每个权重计算出接受单元的误差值与发送单元的激活值的积.因为该积与误差对权重的(负)微商成正比,将其称作权重误差微商.权重的实际改变可由权重误差微商逐个模式地计算出来,即它们可以在该组模式上进行累加.
  
  3故障诊断模型
  
  3.1基于信息熵的粗糙集属性离散化方法
  对于决策表S=(U,C∪D,V,f),对每个连续型条件属性a∈C,论域中其有限个属性值经过排序后为la=va0  对于断点cai,决策属性值为j(j=1,2,…,r(d))的实例中,属于集合X且属于a的值又小于断点值cai的实例个数记为lXj(cai),大于断点cai的实例个数记为rXj(cai),令lX(cai)=r(d)j=1lXj(cai)rX(cai)=r(d)j=1rXj(cai)(7)因此,断点cai可以将集合X分成两个子集Xl和Xr,且有H(Xl)=-r(d)j=1pj log2pj, pj=lXj(cai)lX(cai)(8)
  H(Xr)=-r(d)j=1qj log2qj, qj=rXj(cai)rX(cai)(9)因此,定义断点cai针对集合X的信息熵为HX(cai)=|Xl||U|H(Xl)+|Xr||U|H(Xr)(10)综合以上所述,可给出如下基于信息熵的属性离散化算法,为此首先引进记号:记P为已选取的断点集合;B为候选断点的集合;H为决策表信息熵;Va为属性a的值域;初值由式(6)取为H=H(X),其算法步骤如下:
  (1)P=Φ,H=H(X);
  (2)计算对每个断点c∈B针对集合X的信息熵,记为H(c,X);
  (3)若H≤min{H(c,X)}或者min{H(c,X)}=0,则结束并转式(10),否则转式(4);
  (4)选择使H(c,X)最小的断点cmin加到P中,B=B-{cmin};
  (5)由步骤(4),断点cmin将集合X划分成X1和X2两类,依据步骤(2)针对X1和X2分别计算使得H(c,X1)和H(c,X2)取得最小的断点,分别记为cmin1和cmin2;
  (6)若min{H(c,X1)}  若min{H(c,X1)}>min{H(c,X2)},则转(8);否则转(9);
  (7)令X=X2,H=H(X2),转(2);
  (8)令X=X1,H=H(X1),转(2);
  (9)选取X1和X2中断点数目较少的集合记为Xr(r=1 or 2),并令X=Xr,H=H(Xr),转(2);
  (10)对任一属性a,若存在断点ca∈P,而ca=min{Va}或ca=max{Va},则依据离散化时区间的选择对得到的断点集P进行检查,从而决定对断点ca进行取舍.
  3.2BP神经网络故障诊断模型的构建
  3.2.1故障诊断系统结构
  故障诊断系统的结构框图见图2.图 2故障诊断系统结构
  3.2.2构建过程及步骤
  构建过程及步骤如下:
  (1)构造学习样本集.从收集的原始数据中产生所需要的学习样本,数据的多少取决于许多因素,如神经网络的大小,测试的需要及输入、输出的分布等.其中,网络大小最为关键,通常较大的网络需要较多的训练数据.
  (2)连续属性的离散化及决策表的形成.基于粗糙集的算法对数据的要求之一就是属性必须是离散值.然而,在实际应用领域,相当多的数据是连续的,因此要对数据进行离散化处理.采用离散化后的条件属性和决策属性值形成1张二维表格,每行描述1个对象,每列对应对象的1种属性.
  (3)属性约简.对离散化后的数据利用粗糙集进行约简, 得到约简后各子神经网络输入.
  (4)将约简后的属性数据作为神经网络的输入,并训练神经网络.
  (5)输入诊断集进行故障诊断,并输出诊断结果.[12]
  
  4应用实例
  
  选取文献[11]中给出的某变压器的20组故障诊断样本数据对本文所述方法进行可行性与有效性分析.所构建的故障诊断决策表见表1,其中,A={s1,s2,s3,s4,s5}表示条件属性,分别表示所测的变压器中H2,CH4,C2H6,C2H4和C2H2的相对值;D为决策属性,有5种决策值,分别是无故障、低温放电、高温放电、低能量放电和高能量放电.
  对表1样本数据进行基于信息熵的粗糙集属性离散化方法处理后,所得结果见表2.表 1变压器故障诊断决策表序号s1s2s3s4s5D146.1711.3733.128.520.620241.8833.5114.558.760.540333.4629.3232.9927.782.550446.8135.988.457.490.310515.2221.9817.8546.920.00160.8943.8827.0427.980.001735.1350.968.155.650.001837.9830.957.8723.010.001911.1921.7911.3052.982.392100.9516.0112.8968.410.9621115.0322.193.2657.961.0321220.0831.073.9843.221.5321358.0118.664.688.629.7831486.996.485.281.030.0031585.866.984.512.560.0031683.687.964.452.720.5631720.2316.961.6924.7434.5241826.8616.762.9838.9613.6141943.9224.416.6223.910.5442048.1210.884.2322.4623.684
  表 2离散化后故障诊断决策表序号s1s2s3s4s5D1524350245443033546704553220514471161546117353111835351191347721012475211141762121517721373337314713113157121131671214317221684182216841944363420622584
  按照粗糙集理论所给出的基于差别矩阵的属性约简算法进行约简后形成如下3个约简属性组合,分别为{s1,s3,s5},{s1,s4,s5}和{s1,s2,s3}.任选其中1组作为输入节点构建神经网络.不妨取约简属性集{s1,s3,s5},由于故障类别共分为5种,因此选输出节点为5个,选隐层节点为6个,误差精度为0.001.利用样本数据对所构建的BP神经网络进行训练,其误差曲线见图3.网络经过61次训练就达到预定精度要求.
  图 3BP神经网络训练误差曲线
  利用表2所给待识样本数据对训练好的神经网络进行检验,其结果见表3.从检验结果分析,与文献[11]中的识别结果基本一致,仅有对样本8的识别结果不相一致.在文献[11]中对实际故障为中温过热的样本8识别结果为低温过热,而此处识别结果为高温过热.虽然两者识别结果有些差异,但两者对故障类型的认定完全一致.因此,本文所构建的故障诊断模型具有一定的可行性与有效性.
  表 3故障诊断及诊断结果(最后1列为检验结果)序号实际故障H2CH4C2H6C2H4C2H2检验结果1正常7.35.73.42.73.102低温过热12012033830.5413局部高温过热20.619.87.560.91.5224铁心多点接地4297156598025有局部放电1563933446036工频续流放电200471511512947层间绝缘不良98121322951528中温过热58761822029围频放电31.25.41.312.513.1410磁路高温过热7251813912995.82
  
  5结论
  
  随着设备结构的日趋复杂,故障类别也日趋多样,因此在实际生活中,对故障类别的诊断显得尤为重要.在实际故障诊断中采集到的数据往往是1个真实的数据,而且这些数据样本的分类边界不确定,故障与征兆之间的关系往往也不确定.本文在分析粗糙集和BP神经网络各自用于故障识别时的优缺点的基础之上,充分将两者的优点进行有机结合,并针对粗糙集只能处理量化数据的特点,给出1种基于信息熵的粗糙集属性离散化方法,从而建立1种新的故障诊断模型.通过对应用实例的分析发现,该模型对所给样本基本都进行准确识别,且与文献[8]相比,所需属性数更少.因此,该模型的提出将为有效进行故障识别以及其他诸如识别、分类等领域应用问题的解决提供更多可靠性方法.
  
  参考文献:
  [1]沈永红, 王发兴. 基于信息熵的粗糙集属性离散化方法及应用[J]. 计算机工程与应用, 2008, 44(5): 221-224.
  [2]郭小荟, 马小平. 基于粗糙集的故障诊断特征提取[J]. 计算机工程与应用, 2007, 43(1): 221-224.
  [3]胡寿松, 何亚群. 粗糙决策理论与应用[M]. 北京: 北京航空航天大学出版社, 2006: 4-51.
  [4]PAWLAK Z.ROUGH set[J].Int J Comp & Infor Sci, 1982, 11(5): 341-356.
  [5]曾黄麟. 粗集理论及其应用[M]. 重庆: 重庆大学出版社, 1998: 8-41.
  [6]王国胤. Rough集理论与知识获取[M]. 西安: 西安交通大学出版社, 2001: 117-140.
  [7]梁吉业, 孟晓伟. 信息熵在粗糙集理论中的应用[J]. 山西大学学报: 自然科学版, 2002, 25(3): 281-284.
  [8]袁曾任. 人工神经元网络及其应用[M]. 北京: 清华大学出版社, 1999: 66-68.
  [9]马维国. 纺纱生产BP神经网络模型[J]. 2004, 13(3): 57-59.
  [10]张长君, 邹开其. 恶劣气象条件下高速公路匝道控制的神经网络方法[J]. 计算机辅助工程, 2006, 15(3): 86-88.
  [11]王晓霞, 王涛. 基于BP神经网络的变压器故障诊断[J]. 华东电力, 2008, 36(2): 112-116.
  [12]周天沛. 基于粗糙集—神经网络系统轴承故障诊断[J]. 轴承, 2008(2): 39-42.
  (编辑廖粤新)
其他文献
摘要:为提高建筑铝合金产品的设计效率,将面向对象程序设计方法与工程实际相结合,以AutoCAD为平台,采用VC++建立并使用ObjectARX应用程序,开发建筑铝合金产品CAD软件。在零部件与附件图库的支持下,采用参数化设计思想生成图形,产品物料信息在绘图过程中被存入图元,绘图完成后由程序遍历各个图合金产品设计全过程中,该软件的参数化绘图、物料信息自动提取等模块可以起到良好的辅助作用。  关键词:
期刊
摘要:为对构音异常声道实行辅助治疗,使用Matlab对声道进行动态仿真。采用极点形式在牛顿插值的基础上进行迭代计算出共振峰,对声道进行非线性分段,使用Matlab实现分段后声道形状显示;使用参数Corana改进算法,优化9个声道参数。在进行大量迭代计算获得合适的声道参数后,显示优化后的声道形状。该形状可以为构音治疗师的治疗提供参考。使用声门激励模型产生用于激励的声音,能够合成用于反馈的声音。实验证
期刊
LMS国际公司振动噪声、疲劳试验和仿真解决方案技术交流会在上海召开    2009年4月22日,LMS国际公司振动噪声、疲劳试验和仿真解决方案技术交流会在上海召开,来自泛亚汽车技术中心,上海大众、上海汇众、克莱斯勒、联合汽车电子、汉高、上海海马、上海微小卫星、上柴、常柴、中船等企业、和高校的100多位科研人员参会,《计算机辅助工程》作为支持媒体应邀参会。  会上,石银明博士首先对LMS国际公司及其
期刊
主题:引领自主创新,促进产业升级  时间:2009年7月28-29日  地点:甘肃兰州  主办单位:中国机械工程学会机械工业自动化分会、中国力学学会及其促进工程应用与产业结合工作委员会、中国软件行业协会数学软件分会、陕西省国防科技工业信息化协会  会务承办:北京诺维特机械科学技术发展中心  本届会议适逢CAE年会创办5周年,将由来自科技主管部门、科研院所、制造企业、高等院校的领导、两院院士、知名专
期刊
一年一度的CAE业界盛会——中国CAE工程分析技术年会于2009年7月28—29日在兰州成功举办. 本届年会由中国机械工程学会机械工业自动化分会、中国力学学会、中国力学学会促进工程应用与产业结合工作委员会、中国软件行业协会数学软件分会以及陕西省国防科技工业信息化协会主办,北京诺维特机械科学技术发展中心承办. 来自航空、航天、兵器、船舶、汽车、机械、土木、材料等领域的350多人参会. 《计算机辅助工
期刊
摘要:为提高飞机燃油系统管路设计效率,基于CAA二次开发技术以及CATIA管路模型几何与拓扑信息,开发具有3层架构的飞机燃油系统管路设计仿真软件. 该软件通过中间模型关联CAD和CAE软件,解决它们之间反复的数据传递和重复建模等问题;利用CATIA V5 Tubing Design工作台开发管流分析功能模块,实现飞机燃油系统管路建模时的在线流动分析.实例表明,该软件可提高燃油系统管路设计效率,具有
期刊
摘要:为解决传统二维光路设计和传输仿真中三维可视化不足的问题,通过增强光路设计的三维交互能力,提出基于Open Inventor的可视化三维激光光路布局设计和传输仿真. 借助Pro/ENGINEER完成光学元件和光路模型的建模,以Open Inventor为三维可视化仿真开发平台进行光学元件和光路模型及模型定位功能的管理,实现光学元件和光路模型的三维可视化布局,建立传输仿真场景数据库,并采用基于粒
期刊
摘要:为研究飞艇蒙皮PBO织物的编织单胞并优化编织方案,假设单胞为宏观均匀的复合材料,基于MSC Patran,借助PCL建立参数化2D平纹织物模型,并分析编织纤维间隙、编织纤维截面夹角和树脂层厚度等参数与面内刚度的关系.结果表明,降低编织纤维间隙、减小编织纤维截面夹角、减薄树脂层厚度,可以提高织物面内刚度. 该模型及其模块可以拓展MSC Patran的功能,所开发的程序可为该类材料的编织设计提供
期刊
摘要:为提高结构强度计算效率,增强飞机等结构强度计算工作的协同性,促进强度设计知识和经验的传承,基于CAESAM开发环境构建StrenBox结构强度自动化计算软件平台. 就该平台的基本理论和方法进行阐释,并以1个飞机结构的典型舱段结构为例进行实际应用的演示和说明. 最后,根据飞机等结构强度设计和研究的当前状态,对结构强度自动化计算软件平台的进一步工作进行展望.   关键词:结构强度; 软件平台;
期刊
摘要:为扩展B样条曲线,提出1种均匀二重混合双曲多项式B样条曲线. 该样条曲线在span{sinh t,cosh t,tsinh t,tcosh t,1,t,…,tk-6,tk-5}空间上均匀产生,其中k是大于等于5的整数. 证明k阶二重混合双曲多项式B样条基的性质和二重混合双曲多项式B样条曲线的性质. 二重混合双曲多项式B样条曲线精确地包含双曲多项式B样条曲线. 给出这种新样条曲线的细分公式并证
期刊