论文部分内容阅读
朴素贝叶斯分类器由于其结构简单、计算高效而被广泛的应用,但其条件独立性假设使得属性间的依赖信息得不到利用,影响了其分类精度。因此,隐朴素贝叶斯分类器在朴素贝叶斯分类器基础上为每个属性添加一个隐藏父节点来表示各属性与该属性依赖关系的加权和,使属性间的依赖关系得到了利用。但隐朴素贝叶斯分类器只是考虑了所有单个属性与该属性依赖关系的加权和,忽略了属性对同时作用时对该属性的影响。故本文在隐朴素贝叶斯分类器基础上提出了一种基于条件互信息的双隐朴素贝叶斯分类器,在朴素贝叶斯分类器每个叶节点上添加两个隐藏父节点,基于互信息分别建立其余单个属性和多个属性对该叶节点属性的依赖关系,提高了分类精度,并将此分类模型运用于预测回转窑的喂煤变化趋势。本文主要的研究工作如下:(1)针对朴素贝叶斯分类器条件独立性假设较难满足的问题,在隐朴素贝叶斯分类器(HNBC)的基础上,提出了一种基于条件互信息的双隐朴素贝叶斯分类器(DHNBC)。DHNBC通过在HNBC的结构上为每个属性节点多引入一个隐藏父节点,表示属性对与该属性依赖关系的加权和,其中权值的大小为属性间的条件互信息值。(2)通过结构扩展得到的双隐朴素贝叶斯分类器的隐藏父节点数目增加了,相应的时间复杂度也会增加,因此本文提出了一种新型的阈值定义法,选取的阈值使得分类精度和时间的比值最大,缓解了精度和时间复杂度之间的矛盾。并通过引入M估计方法消除了在概率估计时出现概率为零的影响。(3)通过分析回转窑的工艺特点,对回转窑的热工数据进行预处理,在此基础上建立双隐朴素贝叶斯分类模型,并运用其预测回转窑的喂煤变化趋势。将新提出的双隐朴素贝叶斯分类算法分别在UCI数据集和现场的热工数据上进行仿真实验,实验结果表明,本文提出的双隐朴素贝叶斯分类模型的性能要优于朴素贝叶斯分类模型和隐朴素贝叶斯分类模型。