论文部分内容阅读
在模式识别中多维数据分类是一个重要的研究课题。如今,分类算法存在一些问题:传统的分类算法需要大量计算的问题、分类识别的目标更加复杂的问题、分类结果的可解释性差、分类过程的不可知性等问题。为了解决上述问题,本文研究了怎样以多元图图形特征基元表示和特征融合、特征提取技术为手段来降低分类算法的计算代价及实现分类结果可视化、分类过程可视化,并且提出了基于多元图图形特征基元表示的多维数据可视化分类的一般性方法。首先,在深入分析多维数据多元图表示原理的基础上,对多元图形特征进行了更加深入的挖掘。针对维数在3~15维之间(小高维数据)的数据,根据全息分类(不舍弃任何一个特征信息)的思想,提出了多元图表示和特征提取、变量融合相结合的多维数据可视化分类方法。此方法首先采用径向坐标图表示多维数据,不同类别的多维数据形成的多元图也各不相同,然后应用单原型图形分类器对径向坐标图形进行自动识别。最后进行实验,证明此方法的有效性。其次,针对维数在15~30维之间(中高维数据)的数据,为了实现多元图形的自动识别,需要研究多元图图形的描述方法和有利于机器判别的特征。为此,本文提出了一种特征提取、特征融合与多元图图形特征基元表示相结合的可视化分类方法。该方法先对数据进行特征提取,从而实现多维数据的降维,为了不损失数据信息,将其余的数据进行矢量模长融合,最后进行可视化表示,得到利于分类的标准模板,最后,在此基础上对于维数远大于30维(大高维数据)的数据,本文采用分层、递阶的方法将数据进行多元图表示,也可以将此方法推广到维数更多的数据分类情况。最后应用经典数据集进行实验证明此方法,实现了分类过程、分类结果可视化,并且取得较高的分类精度。