基于机器学习的乳腺钼靶图像肿块检测技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:sunfeaml
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乳腺癌是世界范围内女性致死率最高的肿瘤之一,如何早期发现、规范化诊断、降低死亡率是全世界医学界所面临的重大挑战。乳腺钼靶图像分析是早期发现乳腺癌病变风险的重要手段,也是目前公认的最有效和最可靠的医疗检查方法,可以找到早期乳腺癌病变的相关线索,主要有肿块、微钙化和腺体结构变形等。配合早期的防治措施可以显著降低筛查人群的致癌率和死亡率,在乳腺钼靶图像成像设备与诊断系统普及较全面的发达国家,乳腺癌的存活率可达到80%以上,而在医疗卫生水平较落后的发展中国家,乳腺癌的存活率低于40%。因此,在目前医疗技术对乳腺癌尚无有效预防手段的情况下,如何早期发现乳腺癌是对抗乳腺癌的重要方法。近年来,随着计算机技术的飞速发展,使用计算机实现数字化辅助诊断系统已经成为医疗技术的发展趋势。利用计算机辅助医生进行乳腺癌诊断也成为了必然的发展趋势,数字化的乳腺钼靶图像不仅可以使用更清晰的图像分辨率,也更容易保存、检索和传输,而且计算机可以分析与识别出人眼不能利用的诊断信息。近年来有大量基于乳腺钼靶图像的计算机辅助检测技术被提出,已有部分应用于临床诊断,在最新的研究工作中,一些传统算法还存在着许多不足,有些局限于乳腺钼靶图像中特定类型的病变检测,有些则是算法检测的假阳性率较高,有些则是需要提供较多的人工干预等等。因此,实现自动化的、更准确的、更多样化检测的基于乳腺钼靶图像的计算机辅助检测系统是当前迫切的需求,而从乳腺钼靶图像中自动地、快速地找到异常的肿块病变区域并识别肿块病变是一项具有挑战性的任务。乳腺钼靶图像是一种医学成像的灰度图像,在设计与实现计算机辅助的肿块检测系统过程中,当前存在着下述问题。1、肿块在乳腺钼靶图像中呈现多种不同的尺寸和形状,通常嵌入在正常组织中,与这些正常组织具有较低的对比度差异,采用手工设计特征的传统检测技术难以获得良好的检测性能。2、在进行肿块检测系统的建模过程中,需要大量良好标注的乳腺钼靶图像数据,而这类医学图像数据的标注代价很高,因此如何降低数据集标注的需求是一个亟需解决的问题。3、由于不同的采集设备和参数配置等原因,不同来源的乳腺钼靶图像数据集之间存在较大的差异,如何从精确标注的数据集学习病灶区域的特征并迁移到未标注的数据集,是避免目标数据集标注的一个需要解决的问题。4、由于乳腺钼靶图像中肿块病灶区域占据相对更小的区域,在识别过程中会遇到类别不均衡的问题。针对上述问题,本文进行的研究如下。一、为了提取更佳特征表达进行肿块检测任务,本文利用肿块病灶周围的背景信息和肿块病灶的轮廓特征来扩充特征表达,为此设计了一种基于多背景多任务学习(MCMTL,Multi-Context Multi-Task Learning)网络的肿块检测计算机辅助诊断(CAD,Computer Aided Diagnosis)系统,该系统包括一个疑似区域定位(SRL,Suspicious Region Localization)模块和一个肿块识别的多背景多任务学习(MCMTL)网络模块。疑似区域定位采用显著区域搜索方法在乳腺钼靶图像中找出疑似病灶区域。从疑似病灶区域裁剪出局部子图,由多背景多任务学习(MCMTL)网络进一步判定该区域为肿块区域或者非肿块区域。MCMTL网络可以同时集成多个尺度的局部子图的分类特征和分割特征用于肿块识别,该网络融合了多背景学习和多任务学习并实现了端到端的学习。在公开数据集上的实验中,多背景多任务网络显著地优于所有对照组,基于多背景多任务学习(MCMTL)网络的肿块检测CAD系统分别取得了0.812 TPR(True Positive Rate)@2.53 FPI(False Positive per Image)和0.919TPR@0.12 FPI的肿块检测性能,在与最先进的肿块检测技术的对比中取得了更优异的性能。二、为了解决乳腺钼靶图像中数据标注缺乏的问题,提出了一种基于主动学习和自步学习结合的肿块检测方法,该方法从大量未标注的医疗影像数据中选择少数最优信息量样本进行手工标注,可大幅降低数据集标注的需求,并提供了一种高效的训练策略。为主动学习设计了一种新的信息量评估算法,通过考虑样本的不确定性和多样性找出最优信息量样本;另外,利用自步学习的策略配合主动学习,依据样本的复杂性和自步学习的步长从最优信息量样本中选取最有价值样本。在实际收集的数据集上,本方法取得了0.9220 PAUC(Partial Area Under Free-Response Receiver Operating Characteristic Curve)和0.9643 TPR@2.0FPI的肿块检测性能,优于对照组的主动学习方法和随机抽样方法,同时手工标注的样本数据量也更少,约为数据集总量的20%。三、为了解决乳腺钼靶图像中数据标注缺乏的问题以及标注成本较高的问题,提出了一种基于无监督域适应方法用于乳腺钼靶图像中的肿块检测,利用对抗学习进行模型的训练,从精确标注的数据集学习病灶区域的特征并迁移到未标注的数据集。该方法采用了全卷积网络(FCN,Fully Convolutional Network)用于热图预测;另外,设计了一个域分类器,其利用对抗学习对全卷积网络的输出特征进行调整,使得源域数据的特征与目标域数据的特征尽可能相近。为了进一步提升模型的性能,提出了一种更高效的对抗学习训练方法,用于克服在域分类器更新时的批量值过小以及震荡的问题。在公开数据集迁移到实际收集的数据集的验证实验中,本方法可以取得0.9083 PAUC和0.9479 TPR@2.0FPI的肿块检测性能,优于当前最先进的方法,同时大大地减少训练时间。另外,实验结果也表明,无监督域适应方法在采用更多的未标注样本时,可以取得与使用较少标注样本的监督学习相近的结果。四、为了解决医学图像分析中常见的类别不均衡问题,提出了一种基于生成对抗网络的方法,在特征空间执行合成抽样,即特征扩增,以解决样本的类别不均衡在分类模型训练过程中的负面影响。首先训练一个特征提取器用于将图像映射到特征空间;然后,生成对抗网络运用对抗学习训练特征生成器,其中特征生成器与判别器形成一组最大-最小博弈对抗;特征生成器从任意的隐藏分布中生成特征,以模拟真实的图像特征;最后为了抑制合成抽样中生成的冲突特征,使用数据清洗技术清理不符合预期的冲突特征,获得更优的类别均衡的特征集合分布,以提升类别不均衡学习的性能。两个医疗图像分析任务的实验结果表明本方法可以获得比最先进的现有方法更优或者相当的性能。
其他文献
本文旨在研究求解非凸约束优化问题的基于二阶导数的微分方程方法。原因有三个:一是很多最优化问题的人工神经网络方法都是由微分方程系统来刻画的,系统地研究微分方程方法可能
目的探讨化疗药联合TRAIL后对胃肠道肿瘤细胞存活和凋亡的影响。方法单纯用化疗药抑制肠癌细胞为对照组,化疗药联合TRAIL抑制肠癌细胞为实验组,两组均用MTT法测定存活率和Ann
新城疫(Newcastle Disease,ND)由新城疫病毒(Newcastle Disease Virus,NDV)感染引起的禽的高度接触性传染病。该病主要导致禽类呼吸困难、神经紊乱、黏膜出血、排绿色稀便。
介绍了红外热成像技术和远程红外检测系统在变电站实际使用过程中的原理和使用方法。一种由远程红外监控设备、通信控制及移动控制计算机组成的基于无线局域网的监视、检测、
在新课程理念指导下,语文课堂呈现出多种模式,语文教学不再仅仅是局限在教会学生基础语文知识,而是把语文课堂作为一个丰富多彩的舞台,一个y生活的浓缩片段,一个理想展翅的天空,培
采用多机系统的特征分析法,并应用电力系统分析综合程序(PSASP)对2005年冬季华北电网(含山东电网)和华中电网(含四川和重庆电网)的联网运行方式下的低频振荡进行了研究。分析了联网
当前,在高中开设音乐选修课是一个新的课题,上什么内容?怎样上?都处于探索阶段。我校是从89年下半年开始在高中开设音乐选修课的,内容是欣赏中外名曲。从几年来的教学实践来
德国有着较完善的中高等职业教育衔接方式,以"双元制"为主要特点,在课程结构上以核心阶梯式为主,在学校设置上以专科高中、职业高中和专科学校为沟通桥梁。这为解决目前我国中
随着我国社会经济的快速发展,我国的工民建项目日渐增多,在这种背景环境下,人们对工民建工程的施工造价管理也更加的重视。文章通过围绕施工过程中造价控制所存在的主要问题
介绍了以作者所建立的大型机组调峰运行分析的安全性,经济性和综合评价与优化的数学模型为基础所开发的大型汽轮机组调峰运行分析与优化系统软件。软件界面友好,使用方便,具有良