论文部分内容阅读
目前,人类已经对其所处的自然界有了广泛而深刻的认知。在人类认识世界的过程中,逐渐形成了研究各个领域的学科,如物理学、化学、生物学,在这些学科中人们取得了举世瞩目的成就。而这些成就的取得依赖于一个异常复杂的系统:大脑。由于人脑的复杂性及其特殊性,人们对于大脑的奥秘依然所知甚少。近年来,随着科技的发展和研究水平的提高,越来越多的研究人员开始投入到大脑的研究中,这一领域也被认为有着广阔的研究前景。对大脑的研究,通常集中于脑疾病方面,如抑郁症(Major Depressive Disorder,MDD)。以往典型的是采用脑网络的方法,构建脑网络的确定图,并在确定图上进行频繁子图挖掘和判别性特征选择。但是,由于脑网络的连接结构具有内在的不确定性,如果利用阈值方法直接将其转化成确定图,无论是单阈值还是多阈值,都会造成信息的丢失。若将脑网络构建成不确定图,已有的不确定图频繁子图挖掘算法,主要是面向一般图而设计,忽略了脑网络自身的特点,如脑网络结点的唯一性,这可能影响到脑网络分类的性能。另外,对不确定图的频繁子图模式进行判别性特征选择,确定图中的方法不适用,目前还没有非常有效的方法。针对上述问题,本研究基于核磁共振影像数据,构建脑网络的不确定图,提出了一种面向脑网络的不确定图频繁子图挖掘算法,并提出了一种新的判别性特征选择方法。本文所做的主要工作如下:第一,脑网络的构建。为了充分比较两种网络构建方法对实验结果的影响,本文分别构建了确定图脑网络和不确定图脑网络。确定图网络采用传统的二值化方法,利用稀疏度确保每一个网络有相同数量的边。不确定图网络省略了二值化的过程,但保留了全连接网络中所有非负的边。边的权重计算采用皮尔逊相关系数。第二,提出面向脑网络的频繁子图挖掘算法。该方法根据同一脑网络中节点唯一性和不同脑网络中节点一一对应性的特点,借鉴了确定图中和不确定图中的频繁子图挖掘思想。实验结果表明,该方法有效降低了频繁子图模式的数量和支持度。第三,提出一种新的面向脑网络的判别性特征选择方法。该方法利用每个子图模式在正负样本中出现概率的和、均值、方差、偏度、峰度等指标,把只能应用在确定图中的判别分数函数,推广到不确定图中。为了评价各种方法之间的性能,在本实验数据集下对各个方法进行了实验,并对结果进行了分析与比较。