基于基因突变和组织病理学图像构建结肠癌诊断模型

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yangclio
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结肠癌是世界范围内发病率最高的恶性肿瘤之一,但由于其恶性度高、早期诊疗难以及预后极差的特性,对其精准诊断始终是科学家们急切希望攻克的难题。从腺瘤到结肠癌的演变是一个多基因累计突变的过程,体细胞突变是致癌过程的关键。结肠病理切片是一种判断结肠癌种类和时期的典型方法,但这种方式存在困难,特别是在低分化肿瘤中更难分辨。近年来,由于人工智能的进展,通过深度学习对结肠癌全片图像信息进行自动分型与检测已经变成现实。本研究首先从TCGA数据库获取结肠癌突变和H&E染色的病理学图像数据,并对它们进行预处理。利用结肠癌早期与进展期间突变频率差异的基因建立早期和进展期的随机森林模型,并进一步特征选择,得到了在结肠癌早期与进展期中差异的10个特征突变基因,十倍交叉验证的平均AUC为0.9,表明这10个突变基因可作为区分结肠癌早期与进展期的有效肿瘤标志物。其次基于结肠癌与结肠腺瘤的组织病理学图像,利用病理学专家勾画出的肿瘤组织所在部位,在训练集上应用Inception V3模型来实现肿瘤组织区域和正常组织区域分类,模型在230000次迭代后,在结肠癌验证集中的AUC可以达到0.83,在结肠腺瘤验证集中的AUC可以达到0.815,且在测试集应用模型也可以实现肿瘤部位的准确识别。再利用肿瘤组织病理学图像构建结肠腺瘤、早期和进展期结肠癌的病理学图像的三分类模型,进一步找到了与结肠腺瘤到结肠癌进展过程相关的病理学图像特征,指导临床更加精确的诊断和治疗。最后,结合10个结肠癌早期与进展期间差异的特征突变基因,将突变情况作为分类标签调整Inception V3以构建病理学图像基因突变预测模型,最终发现在早期结肠癌中RELN、DNAH10基因的突变可通过病理学图像独特预测;进展期结肠癌中HMCN1、BRWD3和TSHZ3基因的突变可通过病理学图像独特预测。而ZNF469作为结肠癌早期与进展期中同时预测出的突变基因,在进展期中的病理学特征相对于早期来说更加明显且可以更高的准确度(>0.88AUC)进行预测。综上,本研究利用机器学习的方法筛选结肠癌进展过程中的关键突变以及病理学图像特征,并构建结肠癌病理学图像突变预测模型。最终得到的模型可以达到和病理学家媲美的程度且可以从组织病理学图像中快速、廉价地预测癌症类型和基因突变的能力可能有利于癌症患者的诊断和治疗。
其他文献
随着社交媒体逐渐成为社会主流,网络建设不断完善,以及视频处理设备日益更新,视频数据量达到亿万级别,并以爆炸式速率持续增长。人工处理速度和精度已然达不到要求,对于庞大的视频数据量,需要利用计算机视觉算法高效、精确的处理。时序动作定位可以应用于视频监控、智能安防、自动提取体育视频、智能字幕讲解等场景,应用领域十分广泛。因此,时序动作定位已成为一项重要的任务。时序动作定位的任务要求是检测出未裁剪视频的动
学位
正电子发射断层扫描(Positron Emission Tomography,PET)是一种成熟、先进的核医学分子影像技术,它能在生物体的活体分子或细胞水平上开展定性或定量研究。PET的放射性示踪剂药物具有多样性,不同示踪剂可以表征不同病变细胞的摄取差异。相较其他影像技术,PET成像具有高灵敏度与高特异性,因而在众多医学成像中占据重要地位。然而,由于PET扫描仪的硬件限制、示踪剂的剂量安全以及组织
学位
随着计算机视觉技术的不断发展,手术导航系统被日益广泛地应用在神经外科、骨科以及整形外科等医学领域。手术器械定位跟踪是手术导航系统中至关重要的技术,其定位精度和实时性直接影响手术导航系统整体的性能。基于单目视觉原理的光学定位方法由于其结构紧凑、成本低廉,在手术器械定位跟踪方面具有潜在应用价值。本文分析了近年来光学手术器械定位跟踪技术相关研究,运用多种计算机视觉技术实现了基于单目近红外光的手术器械定位
学位
癌症是导致死亡的主要原因之一,引起癌症发生的因素十分复杂,有证据表明,m6A修饰参与致癌过程,并且lncRNA作为竞争性内源RNA可影响该过程,从而参与肿瘤的发生。目前更多的研究集中于m6A调控蛋白与靶标mRNA的作用,而从lncRNA介导RNA m6A修饰的视角,识别潜在的lncRNA-m6A调控蛋白互作关系对于揭示lncRNA和m6A修饰在肿瘤中的作用机制至关重要。本文从TCGA和GTEx数据
学位
<正>本刊讯为深入学习宣传贯彻党的二十大精神,落实立德树人根本任务,坚持不懈用习近平新时代中国特色社会主义思想铸魂育人,推进滨海新区“大思政课”综合改革示范区和大中小学思政课一体化建设,打造滨城学校思政工作特色,3月24日,滨海新区举办大中小学思政“金课”教学交流会。会议采取领导引学、专家授课、说课交流、集中点评等形式进行。备课交流环节,来自滨海新区大中小学不同学段的思政课教师代表进行了说课展示。
期刊
原核生物的CRISPR-Cas(Clustered regularly interspaced short palindromic repeats CRISPR-associated protein)系统属于适应性免疫系统,CRISPR-Cas系统可以防止细菌和古生菌受到噬菌体的感染。深入的了解CRISPR-Cas系统的天然作用及其可编程特性对于适应性免疫系统的研究非常有启发性,并且可能促进基于C
学位
近些年来,随着低成本深度相机技术的不断成熟,深度图像在许多计算机视觉领域都得到了广泛的应用,例如三维重建、室内SLAM、虚拟现实、增强现实等应用。但是目前市面上的低成本相机,如Kinect、Real Sense等,通常存在分辨率低、深度值缺失、图像空洞、噪声等问题。而这些问题,将会极大的影响三维重建等技术的效果。所以怎么样将低质量的深度图增强是一个迫切需要研究的课题。本文首先对相机原始采集到的图像
学位
Klf7是神经系统中调节细胞增殖和分化的重要转录因子,也是自闭症谱系障碍(ASD)的致病基因,但具体调控机制尚不清楚。在我们之前的研究中,我们发现klf7靶基因在昼夜节律中显着富集。为了确定klf7是否参与昼夜节律的调控,我们敲低了N2A细胞中的klf7,发现昼夜节律基因,尤其是Clock基因的节律性表达被破坏,接下来通过实验证明clock与klf7之间存在调节环路并且klf7的敲低会破坏细胞的昼
学位
推荐系统由于可以缓解大数据时代信息爆炸式增长带来的信息过载问题,成为近些年来发展十分繁荣的领域,备受学术界及工业界瞩目。目前,推荐系统已经借力深度学习技术实现了飞速发展。深度推荐算法利用神经网络强大的特征抽取以及特征建模能力,可以充分表征用户喜好,实现精准的推荐目标,具有十分重要的现实意义和广阔的应用前景。然而,现有的深度推荐算法往往需要堆叠非常深的网络深度以实现较好的推荐效果,对计算资源和实际应
学位
肿瘤的异质性对癌症的个性化诊断和治疗方法提出了巨大挑战,G蛋白偶联受体是人类基因组范围内最大的蛋白质超家族,也是在癌症治疗中研究最多的药物靶点。DNA甲基化是一种常见且重要的表观遗传修饰,在癌症的研究中应用广泛。癌症特异性的生物标志物鉴定对癌症的诊断以及治疗提供了重要应用价值。本研究是以G蛋白偶联受体相关基因作为实验背景,探索这一簇基因在泛癌中的表观遗传修饰(DNA甲基化)的改变,结合使用生物信息
学位