基于医学影像和基因数据的肺癌辅助诊断方法研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:zyjwxb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肺癌的发病率和死亡率位居恶性肿瘤之首。通过影像基因数据的分析从多角度对肺癌进行智能诊断是提高患者生存率的重要手段。在影像学上,早期肺癌的主要呈现形式是各种类型的肺结节,其中疑似肺癌的疑难型肺结节较难诊断,而磨玻璃结节又是疑难型肺结节的代表,因此,通过对PET/CT影像数据的分析来对磨玻璃结节的辅助诊断方法展开研究。肺癌的自动分型和分期对于辅助其个性化诊疗具有重要的意义,在对基因数据进行深入分析的基础上,提出新的机器学习算法进行肺癌的分型和分期。此外,针对目前在肺癌的研究中存在的影像和基因的关联度比较低等问题,开展对肺癌CT影像和关键致病基因的关联分析,探索利用CT影像来预测关键致病基因突变的潜力,以期实现无创地进行基因突变的预测。本文通过对肺癌的PET/CT影像和多组学基因数据的分析以及对现有的辅助诊断关键技术的研究,提出了一些创新性的算法和模型,主要的研究贡献如下:(1)针对磨玻璃型肺结节恶性度高、边界模糊、对比度低、形状不规则等特点而导致分割困难的问题,提出一种基于超体素的3D区域增长分割方法。首先,结合PET图像自动定位CT中的种子点,有效减少用户交互并节省时间;其次,构建3D掩模作为区域增长的约束条件,构建模糊连通图作为超体素之间连通性的度量规则;最后,在模糊连通图上以超体素为基本单位进行3D区域增长,完成结节的分割。整个区域增长过程无需设置种子点和阈值,避免了由于种子点和阈值的选择而导致分割结果的不稳定性。实验结果显示,提出的方法能够获得准确性较高的分割结果。(2)针对肺癌基因数据样本量小、维数高、类别不均衡等问题,采用传统机器学习方法对肺癌亚型进行准确分类仍然具有挑战性。本文提出了一种多级加权的深度森林模型(Multi-Weighted gcForest,MLW-gcForest),基于DNA甲基化进行细粒度的肺腺癌亚型分类。提出的MLW-gcForest模型对标准的深度森林模型gcForest的改进主要包括两个方面:(1)根据随机森林分类能力的差异,将不同的权重分配给不同的随机森林;充分利用不同随机森林之间的相互协同作用。(2)提出了排序优选算法,为不同滑动窗口下生成的特征向量赋予不同的权重,充分利用不同滑动窗口下产生的特征向量的互补性。文中提出的多级加权策略有助于随机森林提取更丰富的多层次特征,从而有效地提高了标准gcForest模型对小样本、高维度基因数据进行分类的能力。实验结果证明了提出的MLW-gcForest算法在肺腺癌亚型分类方面的优异性能。(3)由于肺腺癌复杂的发病机制,使用单一基因数据难以获得满意的分期结果,针对此问题,提出了基于多组学基因数据(基因表达、DNA甲基化和拷贝数变异)的改进的多级加权深度森林模型(Improved MultiWeighted gcForest,IMLW-gcForest)进行分期。首先,针对收集到的肺腺癌的样本为三期,将提出的MLW-gcForest模型中赋予不同随机森林权重的方法根据生物信息学的多流超体积进行改进,构建出IMLW-gcForest模型;其次,采用多组学基因数据作为输入分别训练三个IMLW-gcForest模型,充分利用多组学基因数据之间的互补性;最后,对训练的三个模型进行决策融合,实现对肺腺癌的精准分期。实验结果表明,基于多组学基因数据的IMLWgcForest模型显著提高了肺腺癌分期的准确性。(4)靶向治疗是中晚期肺癌的主要治疗手段之一,针对其基因检测过程存在侵入性、时间长、费用高等问题,本文提出了多通道多任务的深度学习模型(Multi-channel and Multi-task deep learning model,MMDL),以期利用非小细胞肺癌的CT影像来预测关键致病基因EGFR和KRAS的突变。首先,提取3D肺结节的九个剖面视图,利用多视图的互补性来全面表征结节的特征;其次,构建预训练的加入注意力机制的Inception-attention-resnet模型,学习不同视图的图像特征,缓解小样本医学图像导致的模型过拟合问题;再次,通过多通道学习来同时预测EGFR和KRAS突变,使得多项预测任务相互促进。此外,将患者的少许病历信息嵌入模型中,加入更多与突变相关的先验知识。最后,采用自适应加权方案对模型进行决策融合获得最终的预测结果。实验结果表明,提出的MMDL模型具有无创的检测基因突变的潜力。综上所述,本文围绕肺癌辅助诊断的四个问题,从不同的角度进行了相关算法的研究和模型的构建,研究工作具有一定的理论意义和临床应用前景。
其他文献
研究目的和背景胰岛素抵抗和胰岛β细胞功能失调是2型糖尿病发病机制中关键的两大要素。代谢压力导致了胰岛素抵抗和β细胞功能下降。早期胰岛β细胞可以通过代偿性增殖,分泌更多的胰岛素来维持血糖的稳态。但随着代谢压力的持续进展,胰岛β细胞功能发生失代偿,就会导致2型糖尿病的发生。因此,研究如何延缓代谢压力下胰岛β细胞功能的衰退,以及如何促进胰岛β细胞代偿增殖能力来应对增加的代谢压力,是寻找糖尿病治疗靶点的重
学位
蛋白质的功能是由它们的三维结构的构象决定的,蛋白质可以对外界环境的各种变化作出响应,通过改变自身的构象来切换自己的功能角色。特别是作为受体的蛋白质,在结合配体(小分子或短肽)之后,构象会发生相应的变化,最后使蛋白达到特定的状态,如结合激动剂或拮抗剂后,构象变化并使蛋白受体激活或失活,而构象变化并不是在所有区域发生的。追踪这些区域发生的变化以及探索构象变化的分子机制并对构象变化与残基间的互作网络方面
良好的生态环境是可持续发展的重要条件,随着经济社会的迅猛发展,出现了一系列环境问题。其中,土地环境的治理和改良受到广泛关注。微生物诱导矿化技术是一种环境友好型土体改良技术。对微生物矿化土壤的材料力学特性开展系统深入研究,具有重要意义。本文从微生物诱导碳酸钙矿化生物反应动力学过程控制与优化、生成矿化物的微细观力学特性测试、微生物诱导碳酸钙矿化技术改良土体材料力学强度的微细观成因机理、微生物诱导矿化技
大量的城镇污水厂低有机质污泥厌氧消化效能低,成为污泥资源化利用的瓶颈。研究针对城镇污水处理厂低有机质污泥提出低有机质污泥碱-超声同步和热碱-生物预处理技术,提升污泥水解酸化效能。研究利用SEM-EDS、3D-EEM及FRI等技术,对低有机质污泥的基本性质、污泥粒度、表面电荷、有机物组分及结构、BMP等进行了多角度全面解析;考察了pH、接触时间、功率密度、污泥浓度、协同方式等对碱-超声同步预处理系统
本文主要探讨了Hilbert空间上保持高维数值域的映射,套代数上的Jordan同态,套代数的Lie理想中有限秩算子的分解以及一类满足二次交换定理的非自伴算子代数.全文共分四章,具体内容如下.第一章,主要介绍了本文的研究背景,回顾了国内外学者在此之前的研究进展和所取得的一些重要成果.同时,介绍了本文所涉及的基本概念和一些常用结论,并且给出了本文的主要结论.第二章,我们研究了保持高维数值域的映射.主要
昆虫缺乏获得性免疫系统,但在长期的进化过程中形成了复杂的天然免疫系统。因此,当外来病原微生物入侵寄主昆虫时,昆虫会启动天然免疫系统来抵抗病原微生物的入侵。在昆虫与病原真菌的相互作用过程中,病原真菌孢子表面的疏水蛋白对病原真菌进入寄主昆虫体内至关重要。最新研究发现,附着在昆虫体壁的真菌孢子在萌发前就已引起寄主产生体液免疫反应,表明寄主昆虫对真菌孢子表面物质具有快速的免疫反应。疏水蛋白是真菌孢子表面的
电影诞生于法国,它既是艺术又是产业。在1981-2012年期间,法国电影业经历了诸多起伏,面临着众多来自内部和外部的挑战,电影业时常陷入危机。为了解除本国电影业危机、保障其生存、促进其发展,法国采取了一系列经济、法律和政治措施。本文采取历史学研究方法,主要从一手历史文献出发,探讨该历史时期法国电影政策实施的背景、动机,分析政策的具体措施及其产生的历史影响。从1981年左派上台到1988年密特朗第一
激光加工技术因其加工过程中具有局部性、高能量、高柔性、绿色环保等特性被广泛的应用于工业领域中。然而,受到激光光斑尺寸的限制,在实际激光加工过程中,尝尝采用逐道次、逐层搭接加工的方式来完成大型平面及三维尺度上的加工。受到这种加工方式的限制,材料整体性能往往由加工过程中出现的性能最差的区域所决定,因此,在激光加工过程中,需确保每一加工道次中均无宏观缺陷或性能下降的区域出现。在这种加工要求下,实时监控系
煤炭开采造成采空区上方岩层和地表塌陷及裂缝,随着采空区导水裂隙带和地面沉陷范围的扩大,在许多地区,河川径流、洪水的形成与采空区地表水和地下水的水力贯通联系息息相关,所以深入理解采空区产汇流机制,对准确预报采空区特殊下垫面洪水过程是很有必要的。本文以山西省采煤破坏较为严重的汾河水库控制流域为研究区域,首先进行了实地调研,查明了研究流域内土壤质地类型及采空区特殊下垫面裂隙发育特征,以此为依据,设计了采