基于主成分分析的神经网络模型在预测老年人认知状态中的研究

来源 :第四军医大学 中国人民解放军空军军医大学 | 被引量 : 3次 | 上传用户:zhuqs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
老年痴呆症(Alzheimer’s Disease,AD)是指发生在老年及老年前期,以进行性的认知功能障碍与行为损害为特征的中枢神经退行性病变。随着我国人口迅速的老龄化,老年痴呆症患病问题变得非常突出,将成为一个严重的公共卫生问题。该疾病的发病原因尚不明确,发病机制非常复杂,在临床上无有效的治疗方法。因此,对于老年痴呆症来说,早发现、早诊断就显得尤其重要。目前有关AD的研究很多,发达国家十分重视老年性痴呆的基础性研究,相继建立了AD的随访队列,我国也进行了相关的人群研究。此类随访数据有几个显著的特点:(1)数据是纵向的,即研究对象在不同时间点上接受多次测量,各测量值之间是相关的;(2)疾病的影响因素多,因素间的关系复杂;(3)疾病具有较长的潜伏期,且进展不是线性的。由于老年痴呆症的随访数据具有非线性、不平衡性、重复测量间具有相关性、影响因素多等特征,利用常规统计学方法准确预测老年人认知状态是很困难的。目前大多采用线性混合模型来处理纵向随访数据,建立预测模型。该类模型一般要求数据服从正态分布,截距和斜率服从多元正态分布,并且假定疾病是线性进展的。然而,老年痴呆症随访数据很难完全符合上述假定,特别是数据的非线性特征,使得线性混合模型在这一问题上存在一定的局限性。因此,缺乏合适的统计分析方法,已经成为预测老年人认知状态的一个障碍。近年来,人工神经网络在医学诊断、预后、生存分析、临床决策支持等领域中得到了广泛的应用,显示出了较强的预测能力。神经网络模型的输入变量对于预测准确性至关重要,而老年痴呆症随访数据包含非常多的变量,在对该随访数据进行分析与研究时,各变量间的信息具有高度相关以及重叠的特性,从而使得数据统计分析的难度与复杂性增加。若盲目的减少变量个数,则可能会损失很多重要的信息。而主成分分析可以用几个互不相关的综合指标来代替原始变量,达到降维的目的,从而减少神经网络模型的输入层神经元个数,加快网络的训练速度,并可以提高预测精度。本文以美国老年痴呆症协作中心(NACC)的4642例实际随访数据,研究基于主成分分析的BP、RBF神经网络模型预测老年人认知状态,比较这两种模型的预测能力。由于本研究的目的是预测老年人的认知状态,因而以受访者五年随访的MMSE差值作为认知功能的变化指标,将老年人认知状态预测问题转化为随访数据中相关危险因素与MMSE差值的非线性问题。本研究首先进行分类主成分分析(CATPCA),对老年痴呆症随访数据进行降维。在保证原始数据信息可以大部分保留的前提下,将随访数据的16个测量指标转化为8个综合指标(主成分)(累计贡献率达到80.15%),并将这8个主成分作为老年人认知状态的BP、RBF神经网络预测模型的输入变量进行网络训练学习。在基于主成分分析结果的基础上,构建了BP神经网络模型,确定BP神经网络的层数以及各层神经元的个数,选择Sigmoid函数作为网络隐含层和输出层的激活函数。随机选择3000名受访者随访数据作为训练样本,对BP神经网络进行训练学习,比较不同BP神经网络算法的结果表明,在采用Levenberg-Marquardt算法时,网络训练的收敛速度最快。当隐含层的神经元个数为12时,BP神经网络对函数的逼近效果较理想,训练速度最快。将训练好的网络对1642名受访者的随访数据进行仿真,得到BP神经网络预测结果最大相对误差为2.0471,平均相对误差为0.4410。同时,构建了RBF神经网络模型,选择三层网络结构,并确定各网络层的神经元个数,隐含层传递函数选择Gaussian函数,输出层传递函数为线性函数,将主成分分析结果作为输入变量,采用与BP神经网络相同的数据集进行网络训练和仿真,在网络训练的过程中不断调整Spread值。结果表明,当Spread值为1.0时,网络训练的时间最短,且预测精度最好,RBF神经网络对数据具有较好的逼近能力。将训练好的网络对随访数据进行仿真,得到RBF神经网络预测结果最大相对误差为1.2572,平均相对误差为0.3364。本研究的结论为:1.主成分分析法可以在很大程度上减少参与建模变量的个数,极大的提高了神经网络的训练速度,并保证了一定的训练精度;2.BP神经网络和RBF神经网络均具有很强的非线性问题处理能力,通过不断调整BP神经网络和RBF神经网络的结构和参数,两种模型都可获得较为理想的预测结果;3.与BP神经网络相比,RBF神经网络的训练误差曲线收敛更快,预测误差小,稳定性和精度更高;4.基于RBF神经网络方法,我们可以预测受访者更长时间段的认知状态状况。本研究对于准确预测老年人认知状态,提早采取有针对性的预防、治疗措施,并让家庭及时做好相应的准备,从而提高老年痴呆症患者的照护质量、减轻家庭负担等方面具有重要的意义。
其他文献
蝉蛹又称“知了”,主要分布在我国北方地区,因其味道鲜美而被人们食用。到目前为止,对蝉蛹的研究尚少见于报道,并不能充分利用其价值,造成了资源的浪费。目的通过本研究让人们了解蝉蛹的主要营养成分,为新资源食品的开发提供参考,为抗氧化肽的制备提供一种新资源。方法以蝉蛹为研究对象,采用国标法对其营养成分进行分析;采用碱提酸沉法对蝉蛹蛋白质进行提取,使用单因素实验和响应面优化设计确定最佳提取条件;使用蛋白酶水