论文部分内容阅读
提出了一种过滤式和封装式结合的特征选择算法和一种改进的深信度网络的特征选择算法。在对目标进行分类、识别的过程中,若特征的数量过多,会使计算在时间和空间上有较大的耗费,更甚,不相关的特征也会对最终结果造成干扰。对特征进行挑选,筛选出与任务密切相关的最小特征子集,可以使模型更精确,从而避免过了学习、减小空间和时间上的消耗、降低对结果的干扰。 重点做了以下的研究工作: 首先,由于一般的特征选择准则没有考虑变量交互作用,且局部搜索策略难以获得全局最优的结果。所以以遗传算法作为全局寻优方法,结合考虑了变量交互的适应度函数,从而提出一种基于遗传算法和改进互信息公式结合的算法来进行特征选择。在基本遗传算法的基础上,使用改进的互信息公式作为遗传算法的适应度函数。同时提出了使用概率神经网络来对遗传算法的初始化种群特征值进行选择的GA-PNN算法和使用概率神经网络来选择初始种群值、使用改进的互信息公式作为适应度函数的GA-PNN-MI算法来与GA-MI算法进行对比。同时,为了比较BP和PNN分类网络的优劣及验证所选特征的情况,将上面提出的GA-MI、GA-PNN和GA-PNN-MI算法选出的特征分别应用在BP和PNN这2种神经网络的分类器中。 其次,针对图像数据特征较多的情况,提出使用深度学习的方法来进行特征选择。由于传统玻尔兹曼机的距离度量算法较为复杂,使得计算在时间上的开销较大,所以提出使用较为简单的互信息作为玻尔兹曼机的度量算法,并将改进的玻尔兹曼机应用在深信度网络中,构造出一种改进的深度学习网络,即MI-DBNs。同时使用卷积神经网络和卷积自动编码器进行对比实验。 通过对比GA-MI、GA-PNN与GA-PNN-MI算法分别在BP、PNN分类器上的分类精度,检验各种特征选择方法的效果。实验结果表明:使用遗传算法和改进的互信息公式结合的GA-MI方法比GA-PNN、GA-PNN-MI方法所选的特征个数少,且分类精度并没有显著下降,能更为有效地选出特征,同时有较好的泛化性。 对比MI-DBNs、DBNs、CNN与CAE这几种不同的深度学习方法的分类精度和训练时间,实验结果表明改进的深信度网络在图像的较多特征数据时,算法的训练时间短,同时分类精度也没有下降。