论文部分内容阅读
随着生物医学领域中大量数据的产生,如何高效且有效的处理数据,并进行分类是一个值得研究的工作。在这样的背景下,本文对人体生理、临床医疗、流行病学、移动医疗等若干生物医学数据进行分类研究。 对数据进行分类研究主要步骤有:数据清理、数据集成、特征提取、数据归约、优化分类等。本文深入分析了数据分类处理的相关理论基础,研究了分类各阶段的方法,建立了特定疾病数据的模型,确定了可行的分析步骤,针对一些方法存在的问题作了相应的改进,并将改进后的新方法应用于临床医疗诊断、神经信息学、病情预后等领域,并建立了平台创建应用场景,为算法进行了验证,还为未来远程医疗、移动医疗平台建设中将要碰到的关键问题做了初步的理论研究和应用基础研究,大量实验评估表明新方法获得了较好的测试效果。 本论文的研究工作和主要创新点包括几个方面: (1)提出了非负稀疏矩阵分解主成份分析方法并应用于阿尔茨海默病和轻度认知障碍的分类 在使用Freesurfer软件计算出大脑皮层各个不同部分的厚度后,本论文提出了一个基于矩阵分解的非负稀疏主成份分析(NSMFPCA)方法用在阿尔茨海默病(AD)患者、轻度认知障碍(MCI)患者和正常对照组(Normal Control)分类前的特征提取,发现了利用大脑皮层厚度数据分类AD-Normal、MCI-Normal效果很好,但在分类AD-MCI时效果很差。在利用非负稀疏PCA提取特征后,使用支持向量机分类时,这个算法比现有的非负稀疏 PCA速度更快,性能更优。算法不但避免了特征值计算方法的一些缺点,而且在PCA和NMF算法之间的关系给出了一个新的观点,也为设计新的PCA算法打开了一条新的路子。 (2)提出了利用脑电信号进行生物特征识别的基于小波的遗传优化支持向量机算法 在研究了分类前阶段的特征提取算法后,又研究了基于脑电信号(EEG)的四个被试数据的生物特征识别方法。预处理后的数据,用小波变换获得δ、θ、α、spindle、β、γ的12个均值和12个方差。使用主成份分析将每个被试在三个不同警觉度状态的共45个通道的数据样本(共4×3×45=540样本)减少至4个维度。利用优化粒子群算法(PSO)和遗传算法(GA),计算处理参数c和核函数参数g,然后使用支持向量机(SVM)方法对数据进行分类。实验结果表明,不同的算法,使用不同的归一化和降维方法,分类的精度是不同的。基于小波的遗传优化支持向量机(EEGWGASVM)算法通过小波变换获得特征,然后归一化到区间[-1,1],用GA进行SVM的参数优化,提高了分类性能。 (3)提出了P-TAN-Bayesian network算法来对多发性硬化的患者损伤部位与日常生活活动能力做概率分析 有些医学数据无法进行简单的分类和预测。多发性硬化(multiple sclerosis,MS)疾病的损伤和临床残疾之间的相关性很难确定。MS能造成大脑和脊髓的病变,但是具体的量化概率没有人做过相关研究,然而这对临床应用很重要。本论文采用生活活动能力的分级方法,研究了它和损伤部位之间的这种相关性。实验数据来自上海的大规模多发性硬化流行病学调查结果(2004.9.1-2005.8.31)。这些被研究的病人通过核磁共振扫描(MRI)检查了他们的损伤部位和大小,人数总共238人。通过P-值的假设检验特征选择计算,发现基于给定的显著性水平0.05,日常生活活动能力与损伤部位的大小、性别、患者来源地的关系没有统计意义;通过改进的 TAN贝叶斯网络概率计算方法,给出了大脑、脊髓、幕上等位置的病变与日常生活活动能力相关的概率,指出了脑干的损伤与日常生活活动能力的弱相关性。 (4)实现了基于ITK/VTK的医学图像三维重建系统和基于移动医疗技术的远程诊疗网络平台 目前医学图像处理与分析中主要研究问题之一就是通过序列断层医学图像进行三维重建,并重构人体的组织器官的三维形态。本论文在VS2005 C++编程环境下,以ITK/VTK工具包实现一款医学图像三维重建系统软件,将非负稀疏矩阵分解主成份分析方法NSMFPCA整合在此平台中,对未来其它算法预留了接口。 随着医疗服务升级,政府面临着诸多的问题,如何有效地分配医疗资源将是未来面临的难题。本文中实现的基于移动数字平台和云计算技术的远程诊疗协作网络平台,利用移动技术,能够让医疗保健系统更加有效地分配资源。平台能用于数据分析,以便进行相关的研究。该平台拥有数据采集子平台、数据交换子平台、数据管理查询子平台(网络数据库服务平台)、数据分析子平台。用户通过Android和Windows Phone手机访问,也可以通过平板电脑和个人电脑访问,从而在一定程度上解决了医疗资源的分配问题,并验证了本文前几章提出的理论方案和技术方法的可行性和有效性,并为移动医疗平台提供了解决方案。