论文部分内容阅读
随着科技的发展,指纹、人脸识别、虹膜、DNA、遥感等获取目标信息的技术方兴未艾。所采集的数据日益庞大,普遍存在数据量增长很快但同时目标信息获得偏少的情形,典型的数据分析与处理算法在对数据进行分析处理时往往不能得到希望的效果,有些时候还会出现彻底失效的情况。通常在尚未对数据进行分析和处理之前,就开始进行目标特征的提取或选择,使那些不相关的特征被消除,抽取信息量最大,最具相关性的特征,进而为后续工作的开展奠定基础。 本文对常用的特征提取方法进行了分析和研究,并在这个基础上进行了有效算法的开发,其主要内容如下: 1、针对遥感数据,基于主成分变换(PCA)设计了FPCR-ISODATA(Forward Principal components rotation-iterative self-organizing data analysis techniques algorithm)算法。该算法核心是前置主成分旋转与迭代自组织数据分析算法的组合,并将其成功应用于遥感大数据处理,提取感兴趣的目标地物。由于相邻光谱数据的相关性(比如可见光),引入主成分(PC)旋转来产生不相关的成分输出,再进行ISODATA以区分不同的地类,达到自动提取不同地物目标的目的,在环境遥感实时监测有广阔的应用前景。 2、针对实践中广泛存在的数据采集样本量不足的问题,基于奇异值分解(SVD)与独立成分分析(ICA),设计出一种特征提取方法:决策变量分析(DVA)。将兴趣表型的影响去除后,在残差数据中进行独立成分分析,提取关键特征信息。将其应用于特征数量远大于样本量的基因数据,能有效提取出重要特征,为目标或靶基因(致病或癌变)识别做出贡献。