论文部分内容阅读
复杂工业过程细致而稳健的运行状态评价及非优因素识别方法是保证其安全绿色高效生产,提高企业综合经济效益的有效手段之一。针对复杂工业过程中存在的(强)非线性、信息冗余以及标签数据不足(无标签数据多而有标签数据少)等实际问题,本文提出了两种基于自编码器模型的运行状态评价及非优因素识别方法。具体工作内容如下:(1)针对复杂工业过程中存在的非线性、信息冗余以及受不确定性因素影响而难以建立稳健可靠的评价模型的问题,本文引入深度学习中的稀疏降噪自编码器(Sparse Denoising Auto Encoder,SDAE)模型,并在此基础上提出了一种基于综合经济指标约束的SDAE特征提取模型(Comprehensive Economic Index Regularization SDAE,ISDAE)。在SDAE无监督特征学习的基础上引入综合经济指标约束项,迫使自编码器学习与综合经济指标相关的原始数据特征表达,并将其作为输入训练运行状态识别模型。然后,级联特征提取模型和运行状态识别模型,并通过参数微调获得最终的运行状态评价模型。在线应用时,通过引入滑动窗口和信任权值的方式提高在线评价结果的可靠性。当运行状态非优时,本文结合自编码的结构特点,提出了一种基于自编码器贡献图算法的非优因素识别方法,通过计算相应变量的贡献率识别非优因素。最后,将所提方法应用于重介质选煤过程的运行状态评价,通过仿真实验验证了其有效性。(2)针对复杂工业过程中存在的强非线性问题,本文通过堆叠的方式将ISDAE模型拓展为深度结构模型,即深度ISDAE(Deep ISDAE,DISDAE)特征提取模型,学习更加抽象的强非线性特征表达。此外,受生产条件限制、环境扰动以及人员失误等因素影响,过程中与综合经济指标相关的信息不能实时记录,从而一定程度上限制了DISDAE模型学习与其相关的特征表达能力。同时,这类信息的缺失也会导致状态等级标签数据的不足,从而影响了运行状态识别模型的学习效果。为此,本文引入了半监督学习机制,并在此基础上提出一种基于伪标签的半监督学习算法。在利用大量的无标签数据的分布信息的同时,通过迭代学习的方式不断将高置信度的伪标签数据加入有标签训练数据集中,以期望用较小的标注代价不断提升模型的学习能力。鉴于训练数据集中不可避免地存在着部分低质且无关的训练数据,本文还给出了一种基于评价模型精度的数据剔除准则,降低这类数据对模型性能的影响。最后,将所提方法应用于重介质选煤过程的运行状态评价,仿真实验结果验证了所提算法的有效性和实用性。