论文部分内容阅读
针对诊断特征数据中的重复或相似事例样本和特征参量之间可能存在的相关性,提出并实现了一种有效的特征数据双向压缩预处理方法,从而在不损失数据隐含的特征知识的前提下,有效降低学习机器的学习负担。在进行样本参量的降维处理时,采用基于主元分析的横向数据压缩方法,有效地去除了各特征参量之间的相关性。在压缩样本数量时,综述和比较了现有的各种聚类算法,基于竞争和自组织原理,对借鉴生物体的自然免疫系统中克隆选择以及免疫网络自稳定等有关机理的常规免疫聚类压缩算法,作了重要改进,提出了基于主元核相似度的亲和力定义方法,增