基于深度学习的医学图像内容理解关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xz376004565
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对医学图像的内容理解是应用计算机视觉与人工智能进行医学影像分析的基本问题之一,从二维或三维影像数据中理解图像内容一直是医学图像应用研究的重点领域,涉及到感兴趣目标的去噪、分类、检测、分割和检索等研究内容。由于图像内容理解问题本身的困难性和医学图像内在特有的领域先验,如超声特有的斑点噪声,衰减和阴影,导致目标受尺度、旋转和形变等因素影响而形成不同的成像,使得用计算机对医学图像中的内容进行鲁棒的表达与理解依然是一个严峻的挑战。由于不同具体视觉任务分别处于图像抽象的不同层次,解决医学图像的内容理解问题的关键是如何有效结合低层的图像数据信息和高层的语义信息。  以深度学习为代表的人工智能技术在医学影像分析领域取得了引人注目的研究进展。但仍有一系列问题难以克服:如何确定不同网络结构对高效学习医学图像特征表示的影响,如何设计网络结构以适应医学数据量偏少的问题;深度学习具有优异泛化能力从何而来,如何从深度可视化理解深度学习的理论可解释性?学习到的特征表示能否高效应用于不同的医学图像内容理解任务,能否同时应用于分类、检测、去噪和分割等。针对以上问题,论文工作主要涉及深度卷积神经网络自动提取分层递阶图像特征表示,并把不同层次的特征表示应用到不同抽象层次的图像内容理解研究任务上,论文在深入分析传统计算机视觉算法优缺点的基础上,重点研究了应用深度学习的医学图像分类识别、深度卷积神经网络模型的可视化和基于感知损失的去噪模型,并致力于利用形状先验信息结合深度卷积神经网络解决医学图像特定目标检测与分割等问题。论文的主要工作和创新之处在于:  针对医学图像特征表示的高层语义识别分类问题,通过构建超声心动图标准切面数据集,提出了一种基于深度卷积神经网络自动识别分类标准切面的方法,该方法引入空间金字塔均值池化层替代全连接层,利用全局空间金字塔均值池化方法进行微调迁移学习,减少模型参数、降低过拟合风险,详尽分析了数据规模对模型分类精度的影响,并对模型的可解释性和有效性进行了分析,表明深度卷积神经网络能较好地解决医学图像内容理解的高层语义识别分类问题。  针对基于深度卷积神经网络的图像分类模型的可解释性问题,通过评估模型特征空间的潜在可表示性,提出一种用于改善理解模型特征空间的可视化方 法。给定任何已训练的深度卷积网络模型,引入激活最大化的图像可解释性方法,利用空间金字塔分解,并构建多尺度拉普拉斯金字塔主动提升目标图像特征空间的低频分量,结合多尺度高斯金字塔调整其特征空间的高频分量得到较优的可视化效果。并通过限制可视化区域,提出利用类别显著性激活图加以抑制上下文无关信息,可进一步改善可视化效果。该模型有效地克服了原有可视化方法中由于不能主动调整高低频分量等原因造成的可视化图像语义重复和效率低下等问题。  针对自动检测医学图像中指定目标结构时存在的问题,提出了一种基于深度学习自动检测目标位置和估计对象姿态的算法。该算法基于区域深度卷积神经网络和目标结构的先验知识,采用区域生成候选框网络、感兴趣区域池化策略,引入了包括分类损失、边框位置回归定位损失和像平面内朝向损失的多任务损失函数,近似优化一个端到端的有监督定位网络,能快速地对医学图像中的目标自动定位,有效地为下一步的分割和参数自动提取提供定位结果。并在超声心动图左心室检测中提出利用检测额外标记点:二尖瓣环、心内膜垫和心尖,能高效地对左心室朝向姿态进行估计。  针对图像特征表示的低层视觉任务:图像去噪和分割中存在的问题,提出了一个有监督的多层残差全卷积神经网络框架,结合图像内容的感知损失函数学习端到端映射变换;针对医学超声图像难分割的问题,提出一种利用沙漏卷积神经网络特征的多尺度形状模型分割方法,自动定位经食道超声心动图中心室并分割心室内外膜。提出利用堆叠多级沙漏卷积网络建模心室外观的全局和局部信息,统一活动外观模型和局部受限模型的概率形式,采用反向组合梯度下降算法迭代优化分割结果,完成左心室轮廓的自动提取。然后进行详尽实验讨论分析了基于不同层级的沙漏卷积网络对全局和局部纹理特征建模能力,以及对分割效果的影响。实验结果表明,该方法分割效果优于传统形状对齐方法,能够自动定位超声心动图中左心室的初始轮廓和实现弱边界自动分割。
其他文献
信息和网络技术的发展,给人们传播和获取信息带来快捷和方便的同时,也对信息安全方面带来了挑战。如何保证信息在网络中的安全传输是人们非常关切的问题。传统的加密技术通常
语音识别技术的发展已经有50多年的历史,并达到了相当高的水平。在国内,汉语语音识别也得到了充分了研究,已走出实验室达到实用化的阶段。但少数民族语言的语音识别还处于起
学位
在互联网成为人们必不可缺的生活方式的今天,电子邮件是最为快捷、经济的互联网应用之一。同时电子邮件也逐渐成为包括移动通讯在内的,人们主要的信息交互方式之一。但是,垃圾邮
无线传感器网络(Wireless Sensor Networks,WSNs)是一种集信息采集、信息处理、信息传输的综合智能网络系统。在WSNs中,传感器节点以随机自组织的方式协作地感知和采集各种环境
命名实体识别和共指消解是自然语言处理中的两个基本问题,在文本的很多相关任务中都有着重要应用。当前对这两个问题的研究工作主要针对新闻、广播等一些正规的文本语料。随
针对当前地理建模、地理模型共享过程中存在的“模型孤岛”问题,我们提出了分布式地理建模环境的构想。这一构想的目标是为地理学家提供一个便捷的平台,使其能够方便地复用已
随着Internet技术的快速发展和数码照相机、扫描仪等图像采集设备的普及,图像信息呈现出爆炸式的增长,并在遥感、航天、安全、医疗等领域得到了广泛应用。作为一种直观的信息
近年来,我国民航飞行量快速增长。然而,由于管制方式的落后,导致了航班进离港的调度效率较低,在一些繁忙的机场和终端区经常发生空中交通拥挤现象,严重干扰了航班的正常运行,
计算金融是融合现代计算技术、数学理论与方法、金融学理论以解决复杂金融问题的崭新的研究领域。数量化投资管理是目前该领域比较热门的一项研究内容,已经成为金融投资机构争
随着应用多样化和计算需求的不断提升,多核处理器系统在性能、功耗、灵活性等方面优势明显,被广泛用于网络、通信、信号处理、多媒体应用等领域。处理器核数量的增长为系统性能