论文部分内容阅读
流程工业过程的故障诊断对于减少事故和经济损失具有重要的意义。但是,现有的一些故障诊断方法应用于流程工业过程故障诊断效果不是太理想。基于机器学习和人工智能的故障诊断方法由于不依赖于精确的数学模型,引起了流程工业故障诊断领域专家学者的极大重视。基于统计学习理论的支持向量机表现出了优良的分类性能,成为故障诊断领域的研究热点之一。本文围绕支持向量机在流程工业故障诊断中应用的问题,以高炉故障诊断和化工田纳西过程(Tennessee Eastman Process,TEP)故障诊断为背景,提出了改进的支持向量机的新算法,探索流程工业故障诊断的新方法。本文研究了支持向量机的参数选择和优化问题,提出了基于最近邻离散粒子群支持向量机(Nearest Neighbor Discrete Particle Swarm Optimization Support Vetor Machine, NN-DPSO-SVM)的故障诊断新方法。该方法对于带有噪声的训练集,应用最近邻法去除一些用途不大的样本,使得训练集得到修剪。同时,应用改进的离散粒子群算法优化特征选择和支持向量机参数,提高了支持向量机的性能和识别准确率。在对支持向量机性能评价标准问题深入研究的基础上,本文提出了基于成本意识的最小二乘支持向量机的故障诊断新方法。在该方法中,提出新的成本意识公式,将其作为适应函数。该适应函数,可以全面地考虑支持向量机的精度、速度和支持向量的个数,能够更好地衡量最小二乘支持向量机的泛化能力,优化了特征向量和最小二乘支持向量机的相关参数,缩短了分类时间。本文研究了支持向量机的多类分类方法,提出了渐变二叉树的多类分类新方法。该方法对SVM一对多多类分类方法进行了改进,在分类过程中克服了一对多分类方法的分类数目不均衡的不足之处。该方法基于故障样本之间的距离公式,依据故障样本所内含的特点构建了SVM二叉树,符合实际中对故障分类的要求。将其应用于高炉故障诊断实验,得到了很好的分类效果。流程工业过程不同状态的数据样本常常是不平衡的,正常状态的样本数通常多于故障样本数。由于标准的支持向量机对这类不平衡数据进行分类,获得的分类面并不一定是最优的,将使分类器的推广性能下降。为了解决这个问题,本文深入研究了不平衡数据的分类方法,提出了两种新的方法。首先,本文提出可适应支持向量机新算法。该算法由补少类算法和补全算法组成,主要是运用可适应的直推式支持向量机(adapting transductive support vector machine,ATSVM)和改进的最近邻法。补少类算法选取了有意义的少类测试数据。这些样本可以用于补充训练样本的不足。但是,这些数据中也包含噪声数据。因此,给出了改进的最近邻原则,清除噪声样本。补全算法选择有价值的少类和多类测试样本,将它们添加到训练集中。通过和补少类算法相似的方法去除噪声数据。两个算法都添加了测试样本以便保持多类样本和少类样本之间的平衡。其次,本文提出可选支持向量机新算法。该方法是通过修剪训练集,加入无标签数据到训练集中,以补充训练样本的缺乏,使训练集更具有代表性,平衡了少类和多类之间的样本数目的差距。构建了基于故障之间依存特点的固定二叉树SVM多类分类方法,缩短了训练时间,还提高了分类的能力。为实现早期的故障预报,本文提出了新型加权支持向量回归机算法,通过参数变化预测异常状态。基于本文提出的新算法,进行了大量的仿真实验,并与其他SVM故障诊断方法进行了对比。实验结果表明本文的新算法具有较高的分类精度、较快的分类速度和较好的泛化能力。