若干生物医学数据处理中的分类问题研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lxf13098900158
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物医学领域中大量数据的产生,如何高效且有效的处理数据,并进行分类是一个值得研究的工作。在这样的背景下,本文对人体生理、临床医疗、流行病学、移动医疗等若干生物医学数据进行分类研究。  对数据进行分类研究主要步骤有:数据清理、数据集成、特征提取、数据归约、优化分类等。本文深入分析了数据分类处理的相关理论基础,研究了分类各阶段的方法,建立了特定疾病数据的模型,确定了可行的分析步骤,针对一些方法存在的问题作了相应的改进,并将改进后的新方法应用于临床医疗诊断、神经信息学、病情预后等领域,并建立了平台创建应用场景,为算法进行了验证,还为未来远程医疗、移动医疗平台建设中将要碰到的关键问题做了初步的理论研究和应用基础研究,大量实验评估表明新方法获得了较好的测试效果。  本论文的研究工作和主要创新点包括几个方面:  (1)提出了非负稀疏矩阵分解主成份分析方法并应用于阿尔茨海默病和轻度认知障碍的分类  在使用Freesurfer软件计算出大脑皮层各个不同部分的厚度后,本论文提出了一个基于矩阵分解的非负稀疏主成份分析(NSMFPCA)方法用在阿尔茨海默病(AD)患者、轻度认知障碍(MCI)患者和正常对照组(Normal Control)分类前的特征提取,发现了利用大脑皮层厚度数据分类AD-Normal、MCI-Normal效果很好,但在分类AD-MCI时效果很差。在利用非负稀疏PCA提取特征后,使用支持向量机分类时,这个算法比现有的非负稀疏 PCA速度更快,性能更优。算法不但避免了特征值计算方法的一些缺点,而且在PCA和NMF算法之间的关系给出了一个新的观点,也为设计新的PCA算法打开了一条新的路子。  (2)提出了利用脑电信号进行生物特征识别的基于小波的遗传优化支持向量机算法  在研究了分类前阶段的特征提取算法后,又研究了基于脑电信号(EEG)的四个被试数据的生物特征识别方法。预处理后的数据,用小波变换获得δ、θ、α、spindle、β、γ的12个均值和12个方差。使用主成份分析将每个被试在三个不同警觉度状态的共45个通道的数据样本(共4×3×45=540样本)减少至4个维度。利用优化粒子群算法(PSO)和遗传算法(GA),计算处理参数c和核函数参数g,然后使用支持向量机(SVM)方法对数据进行分类。实验结果表明,不同的算法,使用不同的归一化和降维方法,分类的精度是不同的。基于小波的遗传优化支持向量机(EEGWGASVM)算法通过小波变换获得特征,然后归一化到区间[-1,1],用GA进行SVM的参数优化,提高了分类性能。  (3)提出了P-TAN-Bayesian network算法来对多发性硬化的患者损伤部位与日常生活活动能力做概率分析  有些医学数据无法进行简单的分类和预测。多发性硬化(multiple sclerosis,MS)疾病的损伤和临床残疾之间的相关性很难确定。MS能造成大脑和脊髓的病变,但是具体的量化概率没有人做过相关研究,然而这对临床应用很重要。本论文采用生活活动能力的分级方法,研究了它和损伤部位之间的这种相关性。实验数据来自上海的大规模多发性硬化流行病学调查结果(2004.9.1-2005.8.31)。这些被研究的病人通过核磁共振扫描(MRI)检查了他们的损伤部位和大小,人数总共238人。通过P-值的假设检验特征选择计算,发现基于给定的显著性水平0.05,日常生活活动能力与损伤部位的大小、性别、患者来源地的关系没有统计意义;通过改进的 TAN贝叶斯网络概率计算方法,给出了大脑、脊髓、幕上等位置的病变与日常生活活动能力相关的概率,指出了脑干的损伤与日常生活活动能力的弱相关性。  (4)实现了基于ITK/VTK的医学图像三维重建系统和基于移动医疗技术的远程诊疗网络平台  目前医学图像处理与分析中主要研究问题之一就是通过序列断层医学图像进行三维重建,并重构人体的组织器官的三维形态。本论文在VS2005 C++编程环境下,以ITK/VTK工具包实现一款医学图像三维重建系统软件,将非负稀疏矩阵分解主成份分析方法NSMFPCA整合在此平台中,对未来其它算法预留了接口。  随着医疗服务升级,政府面临着诸多的问题,如何有效地分配医疗资源将是未来面临的难题。本文中实现的基于移动数字平台和云计算技术的远程诊疗协作网络平台,利用移动技术,能够让医疗保健系统更加有效地分配资源。平台能用于数据分析,以便进行相关的研究。该平台拥有数据采集子平台、数据交换子平台、数据管理查询子平台(网络数据库服务平台)、数据分析子平台。用户通过Android和Windows Phone手机访问,也可以通过平板电脑和个人电脑访问,从而在一定程度上解决了医疗资源的分配问题,并验证了本文前几章提出的理论方案和技术方法的可行性和有效性,并为移动医疗平台提供了解决方案。
其他文献
本论文应用虚拟现实技术研究基于OpenGL的虚拟现实开发平台设计。OpenGL是一个功能强大的三维图形库,但是在应用MFC程序和OpenGL进行绘制图形和场景时,都是在程序中直接写代码,
本文对网络仿真技术的方法和过程进行了研究,设计实现了一个新的基于设备的网络仿真系统。文章研究了网络仿真系统的建模方法并对已有的网络仿真工具和软件进行分析和比较;结合
随着Java在开发中的广泛应用,关于实时Java的研究已经开始。虽然Java进程委员会(JCP)已经收到了实时Java的规范请求(JSR1),并且已经有很多公司开展了相关的研究,但是一方面由
本论文研究的主要内容为遥感图象中的机场分割与识别。作为一个应用很广泛的领域,目标识别具有很强的针对性和依赖性。在实际应用中,往往是针对不同的目标,提出不同的应用假设,选
利用数字作品中普遍存在的冗余数据与随机性把版权信息嵌入在数字作品中,起到保护数字产品版权或完整性的作用。随着因特网技术的飞速发展,在因特网上允许授权用户远程查询和访
本文讨论了包括预先配置的对密钥管理方案以及基于可信第三方的对密钥管理等几种主要的对密钥管理方案,通过分析无线传感器网络中影响到对密钥管理的几种限制条件,总结提出了
从20 世纪90 年代开始,在国际网络界就进行了许多关于高性能的网络体系结构的研究。但由于这些研究都是基于传统的层次结构网络,所以虽然它能对网络的性能进行改善,但难以解
情绪是一个复杂的心理状态或过程,目前在科学研究领域对于情绪还没有准确的定义。情绪研究不仅对脑功能研究具有十分重要的理论意义,并且对人-机交互应用具有非常重要的现实应
本文主要从说话人的切分和说话人的聚类两个方面讨论了视频中的说话人信息处理。在说话人切分方面,本文详细讨论了说话人切分的三个基本问题:候选切换点的选择、说话人特征提取
微观经济学认为需求与供给的关系是影响价格波动最重要的因素。过去对股票市场的讨论一般仅限于价格本身,却忽略了供求关系与价格之间的内在联系。而不管用什么理论和分析方法