论文部分内容阅读
在实际生活中,传统模式识别方法对于大规模数据的分类和函数逼近并不具有理想的性能。数据量和数据的复杂性以及数据样本的不平衡性,导致分类器在学习过程中的存储消耗大、学习速度慢并且分类及预测方面的正确率不高。本文提出几种新方法:按照马氏距离近邻的原则,剔除冗余数据,选择最小学习子集,在支持向量机和感知器的应用试验结果表明,该方法在分类正确率相当的情况下大幅降低了运算量及存储开销;对不平衡样本的分类采取增加小类别样本权重而达到虚拟平衡的效果,避免了分类决策边界偏移;使用串联感知器分类与预测模型,对每一类别对应一对感知器,一个用于模式的分类,另一个用于函数逼近,这种模块化感知器组实现了对样本的类别与位置同时估计。
试验采取了串联模块化感知器应用上述几种方法对4类香料气味进行识别与浓度估计。结果表明,本文的方法较好地解决大规模及不平衡分类和估计的问题。