论文部分内容阅读
近年来,随着成像设备的发展和普及,从神经影像中学习脑的连接特性,开展基于脑网络的疾病诊断受到广泛关注。机器学习由于能够从数据中自动分析获得规律,并利用规律对未知数据进行预测,已成为一个新的研究热点。本论文基于机器学习的最新研究进展,围绕脑网络分析中的三个方面:脑网络的特征学习、脑网络的相似性计算和脑网络的构建,开展研究工作。主要工作和创新点如下: 1.为充分利用脑网络局部和整体上的拓扑结构信息,提出一种基于拓扑结构的结构化特征选择方法RFE-GK。具体而言:首先,引入图核计算脑网络数据之间的相似性,使选择的特征既利用网络的局部测量特性,又保留网络的整体拓扑结构信息。进一步,为了反映脑网络的多层次拓扑结构特性,采用多阈值的方法阈值化脑网络。最终,采用多核SVM技术融合多层次的网络拓扑特性。实验结果表明,提出的方法不仅能显著提高学习算法的泛化能力和分类性能,而且对检测出可能对疾病敏感的脑区和功能性连接表现了一定的潜力。 2.为充分利用模态之间内在的相关性以及模态数据自身的分布信息,提高多模态数据的分类性能,提出一种基于流形正则化的多任务特征选择方法M2TFS。具体而言:考虑到不同模态的特征对应着相同的基础病理,首先利用组稀疏化项,保证只有少数的特征能被联合地从多模态数据中选取。其次,引入一个流形正则化项,保留了模态数据的分布信息,从而帮助诱导出更具有判别力的特征。进一步,将提出的模型推广到半监督情况,即:semi-M2TFS,实践当中这也是非常重要的,由于获得标签数据(即疾病的诊断)通常是昂贵且费时,而采集模态数据则是相对容易。最后利用APG算法解决优化的问题。与已有的多任务特征学习方法不同的是,提出的方法充分利用了模态数据的分布信息,从而获得了更好的分类性能。在脑网络数据集和ADNI数据集上实验验证了提出方法的性能。 3.为充分利用脑网络数据自身的特点,如:网络中每个节点都具有唯一性(即唯一对应着一个神经元或脑区),并保留网络的局部结构特征,提出一种面向脑网络的新型图核,用于计算脑网络的相似性。具体就是:首先,以脑网络中每一个节点为中心,构建一组子网络来反映网络的多层次局部拓扑结构特性。而后,利用节点的唯一性和不同网络之间节点的一一对应性,构建测量每对子网组相似性的函数,最终获得用于测量一对脑网络相似性的图核。在两个脑网络数数据集上,实验结果表明,相比较已有的图核,提出图核能有效地刻画脑网络数据的相似性并提高脑网络分类的性能。 4.为刻画多个脑区间高阶交互关系,提高脑网络分类的性能,提出一种基于超图的脑网络构建方法,即:超网络。具体就是:首先,基于fMR图像时间序列,利用稀疏学习技术来构建超网络。其次,从构建的超网络中提取三种聚类系数作为特征用于分类。考虑到这些聚类系数特征内在的相关性,且可能包含互补的信息来提高分类的性能,采用了上面提出的M2TFS方法联合地进行特征选择。最后,利用多核SVM技术融合三种聚类系数特征并执行分类。提出的方法提供了一种完全不同以往的脑网络构建方法。实验结果表明基于超网络的方法能够获得更好的分类性能,以及发现一些潜在的与疾病相关的连接。