食管癌预后相关候选生物标志物的筛选及预测模型的构建研究

来源 :重庆医科大学 | 被引量 : 0次 | 上传用户:lele
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的食管癌是常见的消化道肿瘤也是最致命的癌症之一。由于早期无明显临床症状,晚期手术预后效果差,导致食管癌患者总体生存率低。因此,进行准确的预后预测是提高生存率的关键之一。本文旨在通过对食管癌的高通量开源数据进行数据挖掘,筛选出重要基因作为食管癌预后相关的潜在生物标志物,以期为食管癌的预后和诊疗提供理论依据。方法基于TCGA数据库中的食管癌RNA-seq数据及其临床资料,运用R软件中DESeq2和WGCNA包进行差异基因表达分析和加权基因共表达网络分析,提取出差异基因与枢纽基因,并通过生存分析与变量选择等技术筛选出重要基因作为候选生物标志物。最后,利用Logistic回归(LR)、支持向量机(SVM)、随机森林(RF)、决策树(DT)、极限梯度提升算法(XGBoost)五种模型构建食管癌预后预测模型,并对候选标志物的预测价值和分类预测模型的性能进行评价。结果1、差异基因表达分析共筛选出39个差异基因,均为上调基因;通路/富集分析显示差异基因在生物学过程、分子功能项目上具有生物学意义,且具有8条显著通路;生存分析最终保留5个与生存状态显著相关的基因,分别为ATR(HR=1.320,p=0.044)、PPP1R15A(HR=1.354,P=0.000)、RNU6-780P(HR=1.648,P=0.036)、BRDTP1(HR=1.014,P=0.000)、LRRTM4(HR=2.280,P=0.000);2、WGCNA分析,通过构建基因共表达网络确定可能与食管癌最显著相关的基因模块:salmon和purple模块,找出与该模块连接度最高的3844个枢纽基因,经过Lasso和Elastic net变量选择后分别保留15个和22个枢纽基因,并提取出两种方法共同包含的11个基因作为最终的枢纽基因;3、基于提取的差异基因及枢纽基因,利用机器学习算法构建分类预测模型:(1)基于5个差异基因建立的5种分类预测模型,准确率均在79%以上,AUC均大于0.70。特别地,SVM和RF模型的预测准确率分别达到83%和87%以上,AUC达到0.91和0.88;(2)经Lasso筛选的15个枢纽基因建立的5种分类预测模型,其准确率均在83%以上,AUC均大于0.61;经Elastic net筛选的22个枢纽基因建立的预测模型其准确率均在76%以上,AUC均大于0.68(Logistic回归与决策树模型除外);11个共同枢纽基因建立的预测模型其准确率均在83%以上,AUC均大于0.78(决策树模型除外)。这三组基因构建的模型中,SVM与RF模型的预测准确率均在83%以上,AUC均大于0.88。(3)将5个差异基因与11个公共枢纽基因组合建立5种分类预测模型,模型的准确率均在83%以上,AUC均大于0.68(决策树模型除外)。类似地,SVM与RF模型的预测准确率均在83%以上,AUC均大于0.90。结论1、基于生物信息学技术与统计学方法,确定ATR、PPP1R15A、RNU6-780P、BRDTP1、LRRTM4、ATG10-AS1、THA3、TEX101、PLXDC1、DLEC1P1、LINC01357、GREM1、CCDC18、HINT3、YAP1和ELOCP15共16个基因作为食管癌预后相关的潜在候选生物标志物。通过文献查阅与基因功能查询,提示以上基因可能具有作为食管癌预后候选生物标志物的价值,值得进一步的临床实验验证。2、基于构建的五类分类预测模型所筛选出的候选生物标志物均具有良好的预测价值,准确率均在83%以上。其中,SVM与RF模型的AUC均在0.90上下波动,提示SVM与RF模型的预测能力较好。可见,SVM与RF模型的良好预测能力应该能为后续疾病的预后预测提供模型基础。
其他文献
目的:分析有无代谢综合征(metabolic syndrome,MS)的患者的后腹腔镜肾部分切除术(retroperitoneal laparoscopic partial nephrectomy,RLPN)的围术期指标,并探讨代谢综合征与患者术后肾功能的关系。方法:回顾性收集2014年1月至2020年8月因肾肿瘤于我院行RLPN的129例患者的临床资料,根据中华医学会糖尿病分会制定的代谢综合征诊
背景与目的:无创性评估慢性肝脏疾病炎症活动度(hepatic inflammatory activity,HIA)对于制定临床决策和监测治疗效果至关重要。通过提取全肝和肝右叶局部区域的组学特征开发基于磁共振成像(Magnetic Resonance Imaging,MRI)的影像组学模型,比较两种影像组学模型对HIA的评估效能,并开发用于个性化评估慢性肝脏疾病炎症活动度的影像组学诺莫图。材料与方法
目的:探讨胰十二指肠切除术后远期胆道并发症的相关危险因素。方法:对开始收录起至2020年8月间Cochrane library、Pub Med和Embase数据库发表的有关胰十二指肠切除术后远期胆道并发症危险因素的文献进行检索,使用Rev Man5.3软件对提取的数据进行meta分析。结果:共检索到479篇文献,根据质量评估和排除标准筛选后,最终纳入11篇文献,共6544例患者,其中457例发生晚
目的:免疫营养状况与危重疾病的临床结局相关。最近,据报道控制营养状况(CONUT)评分和预后营养指数(PNI)可预测癌症和其他疾病的预后。这项研究的目的是探讨重型颅脑损伤(STBI)患者的CONUT评分和PNI与6个月预后之间的关系。方法:回顾性分析78例STBI患者的临床资料,包括CONUT评分和PNI。将患者分为高CONUT组和低CONUT组,高PNI组和低PNI组。通过改良的Rank量表(m
目的:探讨成人HCM患者的临床特点及诊疗现状。方法:查阅电子病历系统,收集2014年1月—2019年10月期间于我院住院治疗的成人HCM患者,回顾性分析HCM患者的临床资料。结果:共收集到128名成人HCM患者,HCM患者常见合并疾病有冠心病、高血压、糖尿病等,并疾病发有心力衰竭、心房颤动、缺血性卒中等。HCM患者症状大多表现为胸闷/胸痛、头晕、呼吸困难、心悸、晕厥等。HCM患者中β-受体阻滞剂使
目的:探讨肾动脉栓塞术(Renal Artery Embolization;RAE)联合后腹腔镜治疗T2期肾癌的可行性和安全性。方法:临床资料来自我院泌尿外科2015年1月1日至2020年1月1日收治的51例单侧肾癌住院患者,其术前分期均为T2。其中21例患者手术方式为RAE联合RLRN(介入组),余30例仅行RLRN(对照组),介入组患者在栓塞术后3天内行后行外科手术。结果:收集的51例患者中仅
目的:脊柱内镜手术通道建立尤为重要。本文将介绍一项用于胸椎内镜手术穿刺和定位的新技术:“锚定技术”,并客观评价其在经皮胸椎内镜治疗胸椎黄韧带骨化症中的应用价值。方法:回顾性分析2016年10月至2019年10月,我科采用结合“锚定技术”的经皮胸椎内镜手术治疗的16例单节段TOLF患者的临床资料,其中T6/7节段1例,T9/10节段4例,T10/11节段8例,T11/12节段3例,记录手术时间、术中
背景与目的:血肿周围水肿(Perihematomal Edema,PHE)是导致脑出血患者预后不良的重要因素,但至今尚缺乏理想的相关血肿周围水的影像学参数作为评估PHE的指标。本研究提出应用ICH后72小时PHE的平均Hounsfield值作为预测不良临床结果的指标,并通过回顾性对照研究,验证和分析ICH后72小时PHE的平均Hounsfield值能否成为评估预后的独立因素。方法:ICH患者来自三
目的 通过检测非孕妇女、足月待产、先兆临产与临产时孕妇血清皮质醇的水平,探讨血清皮质醇水平与临产启动的相关性。方法 运用量子点免疫层析法测定育龄期非孕女性的血清皮质醇(对照组),以及足月妊娠未临产孕妇血清皮质醇(待产组),足月妊娠先兆临产(先兆临产组)及临产孕妇(临产组)血清皮质醇。结果 与对照组(7.83±4.78ug/d L)相比,待产组血清皮质醇(17.7±3.75ug/d L)及先兆临产组
目的:为减少侵入性检查的次数,提高超声诊断的准确性,本研究旨在通过基于临床特征及超声成像建立宫腔粘连诊断评分表,来预测有无宫腔粘连及宫腔粘连的严重程度。研究对象及方法:回顾性分析我院2016年5月至2019年9月因月经减少、闭经或临床不孕等因素行宫腔镜检查患者的临床特征及影像学资料。行logistic回归分析,筛选、赋值,建立并验证宫腔粘连诊断评分表。并进行一致性检验。统计分析采用软件SPSS 2