论文部分内容阅读
PCA是一种线性特征提取算法,通过计算将一组特征按重要性从大到小重新排列得到一组互不相关的新特征。但该算法在构造特征子集的过程中采用等权重方式,忽略了不同属性对分类的贡献是不同的。本文提出了一种把属性加权和PCA相结合的算法,通过最小化加权子空间与分类标记的距离得到各属性的权重值。得到的权重值反映了各属性对分类的贡献大小,这样生成的特征子集更有利于分类。实验结果表明,改进后的算法分类性能优于PCA算法。