论文部分内容阅读
肝病因其高传染性、高发病率严重威胁着现代人的身体健康。深度学习的出现极大的促进了肝病诊断模型的发展,然而肝病数据的高维度、高噪声问题一直是影响模型准确率和效率的主要原因。因此如何利用深度学习从复杂的肝病数据中提取出重要的特征信息并建立准确、高效的肝病诊断模型是近年来肝病诊断研究的热点之一。本文以肝病诊断为主要研究对象,探讨诊断模型构建过程中的特征提取方法和诊断模型的建立。首先,基于改进的自编码器(AE)对肝病数据进行特征提取;然后建立了自适应集成栈式关联降噪自编码器肝病诊断模型(SISCDA);最后设计并实现了肝病辅助诊断系统。具体工作如下:(1)针对AE在特征提取过程中忽略了数据结构关系在重构过程中的变化,而导致特征提取能力不足的问题,提出了一种新的特征提取算法SCA。该算法通过在AE的目标函数中添加全局和局部关联性限制来保持重构前后的特征数据关系结构不变,并将添加了关联性限制的AE称为CAE。然后将多个CAE堆叠成栈式关联自编码器(SCA),以此来进一步提高算法的特征提取能力。在4组实验数据集上的实验结果表明,SCA特征提取算法的性能均好于其它机器学习特征处理算法以及传统的AE算法。(2)针对肝病数据多种噪声干扰导致诊断模型准确率下降的问题,本文基于降噪自编码器(DAE)和SCA并结合集成学习提出了一种新的肝病诊断模型SISCDA。该模型首先利用DAE的去噪方式对SCA进行去噪训练,使得SCA兼具特征提取和去噪的能力,并将其称为栈式关联去噪自编码器(SCDA)。随后利用集成学习将多个SCDA进行集成来处理肝病数据的不同噪声。针对集成方式,本文又提出一种自适应权重集成方法。该方法在更新SCDA的权重时,根据相邻两次训练结果的误差来动态的调整权重。实验结果表明,相比其它集成肝病诊断模型,SISCDA可以有效解决肝病数据的噪声问题并提高诊断的准确率。(3)在上述研究的基础之上,本文还基于Java EE平台相关技术设计并实现了一个肝病辅助诊断系统。论文先具体分析了系统的相关需求,然后对系统的架构、功能模块和数据库进行了详细的设计,最后利用现有技术实现了模型训练、肝病诊断和统计结果展示等相关系统功能。在方便了肝病患者的同时,也验证了论文所提算法的可行性。