【摘 要】
:
肝癌是致死率较高的癌症类型,而肝癌在中国具有很高的发病率,全球一半的肝癌患者在中国。在肝癌术前进行预后分析,病理医生通过观察肝癌组织病理图像,并结合患者情况判断患者的预后,从而制定针对性的治疗方案。由于肝癌病理图像结构复杂且信息丰富,而且病理医生人才稀缺,造成了医疗资源的紧张。使用机器学习辅助进行预后分析,可以减轻病理医生的负担,病理医生可以更加专注于患者的治疗,从而提高肝癌的治愈率。本研究使用图
论文部分内容阅读
肝癌是致死率较高的癌症类型,而肝癌在中国具有很高的发病率,全球一半的肝癌患者在中国。在肝癌术前进行预后分析,病理医生通过观察肝癌组织病理图像,并结合患者情况判断患者的预后,从而制定针对性的治疗方案。由于肝癌病理图像结构复杂且信息丰富,而且病理医生人才稀缺,造成了医疗资源的紧张。使用机器学习辅助进行预后分析,可以减轻病理医生的负担,病理医生可以更加专注于患者的治疗,从而提高肝癌的治愈率。本研究使用图像处理和计算方法提取肝癌病理patch的定量特征,基于这些特征进行分类和生存风险预测,最后使用生存风险对肝癌进行分期,同时挖掘与预后相关的重要特征。由于原始的图像WSI像素量可达到百亿级,研究中首先分割肝癌病理WSI,得到像素为256*256的肝癌病理patch;在对肝癌病理patch进行图像预处理后,使用构建的CellProfiler特征提取流水线计算patch的定量特征;然后基于提取的特征,使用XGBoost分类模型将patch分类为癌和非癌;之后依据分类结果,从每张WSI中采样36张具有代表性的癌区域patch,使用这些patch预测肝癌患者的生存风险,预测使用XGBoost和Cox结合的模型,病人的生存风险为采样patch的预测均值;最后使用生存风险中位值对肝癌患者进行分组,并按组分别进行TNM细分期和绘制生存曲线,以验证预后模型的性能。实验中分类模型和预后模型的数据都是CellProfiler提取的定量特征,而加入分类模型的目的是挑选癌类别的patch,以用于提取特征。为了验证CellProfiler提取的定量特征的有效性,还使用LBP算法和GLCM算法提取病理patch特征,并将特征用于训练同种分类模型,比较分类模型的准确率。另外,实验探究了不同放大倍率和不同patch类别比例对预后模型的影响,其中肝癌病理图像有10倍和40倍两种放大倍率,不同类别比例指每张WSI采样的36张patch中癌和非癌类别的比例。实验最优分类模型是XGBoost,使用随机森林和SVM进行对比,而预后模型是XGBoost和Cox结合的模型,将XGBoost和Cox模型结合可以充分利用生存资料中的大量删失数据,从而提高预测的生存风险的一致性指数(concordance index)。本研究的训练和测试集数据来源于上海复旦大学附属某医院,验证集数据采自TCGA(The Cancer Genome Atlas)肝癌数据集。经过大量实验,实验中提取定量特征728个,最优分类模型为XGBoost,在验证集准确率最高达到86.9%;预后模型为XGBoost和Cox回归模型的结合,预测的生存风险一致性指数达到了0.67。分类模型和预后模型的特征均由CellProfiler提取,最优模型数据输入为x40倍率的肝癌病理patch。通过实验对比,发现提取特征使用x40倍率图像效果要优于x10倍率图像,癌区域patch比非癌区域patch更影响预后结果。本文最后通过TNM细分期和Kaplan-Meier分析对预后模型性能进行了验证,实验结果表明基于机器学习的肝癌预后分析是具有医学意义的。
其他文献
三维重建是机器人领域和计算机视觉中的一个热门的研究课题。传统重建方法通过稠密视角下的帧间匹配来估算相机位姿变化,进而完成重建,因此受限于视角数量、传感器噪声、反射条件等因素的制约,重建的结果可能缺失关键结构,从而影响接下来的形状分析和交互工作。本文通过引入深度学习方法来弥补这一问题,具体体现在研究扫描视角预测和三维结构预测之间的关联性,并设计统一的深度学习模型实现在三维重建过程中视角规划与三维重建
随着移动互联网络、云计算中心网络和物联网等新型网络的不断涌现,出现了新型的网络技术SDN(Software-defined networking,SDN)。SDN给网络管理带来了很大的便利,但是大型数据中心中的巨大网络流量给SDN网络的数据转发平面带来了巨大的压力。OpenFlow交换机只能存储有限的流表,有限的流表资源和计算资源会成为SDN发展的瓶颈。SDN中也会出现网络安全问题,当网络被攻击时
我国正处于经济转型重要时期,在人口、资源、环境等约束日益突出的复杂发展形势下,十八届五中全会提出了五大新发展理念,其中就包含了“创新”和“绿色”,绿色创新则成为了节约资源、保护环境,促进社会持续进步、提高生产效率和改善环境生活质量的有效途径。同时,随着长三角一体化发展被提升至国家战略层面,长三角一体化发展也成了学术界的热点话题。长三角区域是目前我国区域经济一体化发展最活跃、开放程度最高、创新能力最
生育关系着人类的延续,不少人也把生儿育女当做人生大事。在传统生育文化和国家生育政策的共同促进下,许多女性发出了“我想要个孩子”的呼唤。但是,随着生活节奏日渐紧张,生活环境逐渐变化,部分女性已经无法自然怀孕生子。此时,辅助生殖技术的出现给她们带来了希望,这一技术被誉为不孕患者的“新希望”。当前的研究主要从医疗技术出发关注影响受孕成败的因素,如何进行干预等。但是,女性在此过程中的具身体验以及身体受到来
随着阿里巴巴的B2B平台的不断发展壮大,原有的各种引流渠道能引流能力逐渐遇到了瓶颈。传统的引流方式,例如SEO和PPC,都受限于搜索引擎,引入的流量的数量和质量比较单一。平
铬是一种常见的重金属,具有广泛的工业用途,在矿山开采、金属冶炼、电镀、化学药剂生产等工业过程中都会排出大量的含铬废水。水中铬以Cr(Ⅵ)和Cr(Ⅲ)两个价态存在,其中Cr(Ⅵ)难以降解,其毒性较大而难于处理,对自然环境和人类社会造成了威胁。传统的处理方法主要包括物理吸附和化学沉淀,吸附法具有低成本、低污染、高吸附量的优点,得到了广泛应用。活性炭由于原料来源广泛且廉价易得,是吸附材料的极佳选择。虽然
近年来,随着光伏产业的蓬勃发展,全国太阳能级硅料产量已超过40万吨,据统计,将有40%的高纯硅料以亚微米级切割锯末的形式进入切割液中,如此大量细微的切割废料直接排放必然带
近些年来,百度作为全球最大的中文搜素引擎,拥有数千亿的中文网页数据库,每天的访问流量已经非常庞大。然而,随着互联网的蓬勃发展,用户的搜索产品也不断地变得丰富。为了帮
口腔种植义齿追溯其起源已有上千年历史,随着种植体设计的不断革新、外科技术的不断成熟以及人们生活水平和口腔保健意识的不断提高,近来口腔种植义齿已成为口腔常见修复技术。种植义齿的成功率取决于种植体与骨界面之间的良好整合过程,而该过程则需要种植区有足够的牙槽骨骨量。但在临床工作中,常见由于先天发育不足、外伤、肿瘤或拔牙后牙槽骨吸收、萎缩等原因造成种植区骨量不足,而无法满足种植手术适应症的患者。如何解决种
随着传统学院派历史陷入困境,公众史学兴起并迅速发展,史学界日益关注历史学如何走出象牙塔,打破专业壁垒,面向公众,融入公众。科学史作为典型的精英历史,应该自觉接受这一变