论文部分内容阅读
目前,稀疏优化算法近来是学术界研究的热点之一,被广泛应用于自然图像处理、信号压缩感知、计算机视觉和医学影响处理领域。与此同时,稀疏编码与正则化的方法在医学影像分析领域被用来解决很多问题,例如,围绕人类大脑MRI数据针对正常人脑不同的状态进行模式识别,或是不同被试的脑部疾病状况等模式识别问题。但是在MRI数据问题当中,由于数据样本数量要远远少于每个样本的特征数目,对该问题的求解往往会产生过拟合的问题,即所谓的维数灾难,从而严重影响数据分析的质量。针对高维小样本这个挑战性的任务,LASSO模型被广泛应用于解决高维变量选择的问题,以LASSO模型为基线的稳定性选择思想较大程度上的克服了LASSO模型存在的问题,但是针对MRI数据本身存在的特点,仍然存在不能有效克服其变量之间的高度相关性(即多重共线性)、假阴性控制差等问题。本文主要利用稀疏优化算法的思想,基于稳定性选择的框架,针对人类大脑MRI数据具有局部连续性和相关性的特点,寻找先验结构信息,将稀疏概念扩展到结构稀疏,对MRI数据进行约束块随机子采样,提出了随机结构稀疏(Randomized Structural Sparsity,RSS)的算法框架。本文的贡献为:1提出了一个广泛实用的算法框架思想;2在建模阶段,寻找并利用数据内在的结构先验信息;3针对MRI高维小样本数据,在继承稳定性选择有效控制变量选择假阳性的基础之上,显著提升对假阴性的控制;4与单变量方法(T检验)和多变量方法进行对比实验,得到的结果更好,并且具有更高的可解释性。本文给出MRI数据实验的结果来验证算法的有效性和可靠性。