论文部分内容阅读
医疗健康数据是人们感知健康状况的重要途径,而健康数据主要通过医院的医疗化验单、检测报告和可穿戴的传感器等检查手段获取。从不同医院、不同途径获取的医疗健康数据存在着多源化、多层次以及结构差异较大等问题。如何对这些多源数据进行处理和分析成为了当前亟待解决的问题。本文的目标是通过深度学习技术对多源的健康数据进行分析,并挖掘隐含的内在价值信息,使其可以为医院管理提供更好的决策支持,为用户提供更加全面精准的健康风险评估。本文的研究内容如下:首先,针对纸质医疗单据的多源性问题,本文提出了一种基于深度学习的多源医疗单据的识别的模型。该模型对医疗单据图像进行降噪、抗扭斜、膨胀和腐蚀等形态学操作;然后提出了一种改进的inception卷积神经网络对阈值分割后的图像进行分类,为医疗自动识别医疗单据中的文字奠定基础。其次,针对图像中文字识别难的问题,本文提出了一种适用于识别多源医疗单据文本的深度学习模型:SCRNN。该模型将卷积神经网络与长短周期神经网络相结合以充分提取图像中的空间特征及文本的上下文关系,达到将医疗单据的数据结构化,从而可以完成个人健康数据的采集,逐渐形成历史健康档案。与开源引擎Tesseract相比,SCRNN中英混合词组的识别方面准确率较高,准确率为97.2%。最后,针对心脏病难以通过心电图进行自动诊断的问题,本文提出了一种基于长短周期神经网络的实时ECG诊断模型M-ECG。该模型采用标记后的双导联ECG信号作为训练数据,在模型训练过程中,将三组连续的心拍作为下一个周期的输入数据,同时将多个导联的不同时刻的数据用以训练诊断模型,从而有效地提高了M-ECG预测的准确率。M-ECG模型已在MIT-BIH心律失常公开数据及上进行了验证,实验结果表明:M-ECG具有比1D-CNN更高的精度和更好的性能,与同类的深度学习网络相比,该模型对ECG信号预测的准确率有所提高。