论文部分内容阅读
随着计算机技术的广泛应用,电子医疗健康数据(Electronic Healthcare Records)也急剧增加,数据驱动的医疗数据分析方法也应运而生。通过合理地对医疗数据进行分析,可以在患病早期实现对疾病的提前诊断,或者根据病人的体检记录等数据对其身体健康状况进行分析,预测他未来患某种疾病的风险。然而,由于医疗数据格式混杂、很多记录不完整、含有大量噪声等问题,导致现在对于医疗数据的分析仍有较大难度。本文采用最新的深度学习模型,针对医疗数据中最常见的医疗检查图像和电子病历文字记录这两种格式的数据分别设计了不同的神经网络结构,并实现了对于疾病的提前诊断和风险预测。对于医疗检查图像数据,本文大脑核磁共振图像为例,首先将图像数据矩阵化,并计算大脑不同兴趣区之间的相关系数,之后设计了与此数据最为契合的Autoencoder的深度学习模型,提取不同兴趣区之间的相关性特征,对阿尔兹海默病实现精确的提前诊断。对于电子医疗病历数据,本文首次构建了3D卷积神经网络和空间金字塔池化相结合的模型,通过3D卷积神经网络提取数据内部特征和不同数据之间的时序特征,通过空间金字塔池化结构使模型可以处理任意长度的输入,实现对于心力衰竭和糖尿病的风险预测。两种模型的实验结果都表明,深度学习模型在医疗数据处理中拥有巨大优势,进行疾病提前诊断和风险预测的效果远好于其他传统的机器学习算法,还可以根据实验结果分析对于疾病影响最大的因素,有助于医生分析疾病的致病机理。并且,该方法可以很方便地扩展到其他种类的医疗数据分析或者疾病诊断与预测任务中,对医疗数据的有效利用,在发病早期提高确诊率和治愈率,提升医疗健康水平都有重要意义。