胃癌遗传风险预测模型及多组学生存预测模型构建

来源 :南京医科大学 | 被引量 : 5次 | 上传用户:netting_fish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
胃癌是常见的消化系统肿瘤之一。我国是胃癌的高发地区,其发病率及死亡率均占所有恶性肿瘤的第二位,给我国带来严重的疾病负担。由于胃癌早期发现较为困难,大量患者诊断时已是晚期,即使对其进行以姑息手术为主的综合治疗,多数患者依然会出现复发或转移,预后较差。而对于早期的胃癌患者,可以施行根治性手术切除为主的治疗方法,且预后良好。因此,胃癌的早期发现和早期诊断对于提高患者的预后状况意义重大。建立胃癌风险预测模型,对胃癌高危人群辅以常规胃镜检查等方法,以实现对胃癌的早发现和早诊断,将大大改善胃癌患者的预后。与此同时,对于胃癌患者建立胃癌预后评估模型,从而指导临床治疗方案,也将利于提高胃癌患者的预后,有效改善胃癌患者的生活质量。胃癌的发生发展是一个多因素、多阶段的生物学过程,遗传因素在胃癌的发病机制中起到了至关重要的作用。目前,基于全基因组关联研究(genome-wide association study,GWAS)等方法已经发现数十个与胃癌易感性相关的单核苷酸多态性位点(single-nucleotide polymorphism,SNP)。基于胃癌遗传易感性的研究成果,建立胃癌遗传风险预测模型,对于筛查胃癌高危人群,实现胃癌患者的早诊早治,改善胃癌患者的总体生存情况有着非常重要的意义。胃癌患者的预后是影响患者生存质量及医生选择治疗方案的重要依据。目前在临床实践中,应用临床指标对肿瘤患者预后进行预测已经很普遍,而高维分子学指标的应用却很少。联合使用临床指标与分子学指标将有效提高预测模型的适用性和准确性。本研究将基于现有的胃癌遗传易感性位点,采用不同的方法,尝试建立胃癌遗传风险预测模型;同时,联合临床变量及多组学数据,采用不同的策略,进行胃癌多组学的生存分析,为胃癌预后判断提供参考。第一部分基于全基因组关联研究(GWAS)的胃癌遗传风险预测模型构建背景:胃癌是我国消化系统第一大肿瘤,严重威胁着人民的生命健康。对于早期的胃癌患者,可以施行根治性手术切除为主的治疗方法,且预后良好。而对于中晚期胃癌患者,多数患者无法手术或只能采用姑息手术,并联合化学治疗和放射治疗,预后较差。胃癌起病隐匿,待患者出现临床症状时多数已发展为中晚期。近年来,尽管胃癌的治疗有了长足的进步,但胃癌的早期诊断仍然不如人意。根据胃癌遗传易感性位点,建立胃癌风险预测模型,对于筛查胃癌高危人群,实现胃癌的早诊早治,改善胃癌患者预后及提高生存质量有着重要的意义。方法:采用病例-对照的研究方法,结合既往报道的胃癌易感性SNPs位点,使用中国人群 dbGaP(the Database of Genotypes and Phenotypes)胃癌 GWAS 数据,采用 sGRS(simple genetic risk score)、wGRS(weighted genetic risk score)、1GRS(Lasso genetic risk score)和 dGRS(doubly weighted genetic risk score)四种遗传风险评分方法,建立胃癌风险预测模型,并在本课题组胃癌GWAS数据中对模型预测效果进行了外部独立样本的验证。使用AUC(area under the curve)、净重分类指数(netreclassification improvement,NRI)和整体鉴别指数(integrated discrimination improvement,IDI)对模型预测效果进行评估。结果:分别以四种模型中遗传风险评分最低的一组为参比组,sGRS≥12组,相对危险度为5.32;wGRS>P75组,相对危险度为3.28;1GRS>P75组,相对危险度为3.51;dGRS>P75组,相对危险度为3.71,差异均有统计学意义。四种模型中,dGRS 模型具有最大的 AUC(0.647,95%CI:0.629-0.666),且 NRI 和 IDI较其他模型均有提高。该结果在本课题组验证数据中得到验证。结论:四种遗传风险预测模型对胃癌患者均有一定的区分力,且dGRS模型对胃癌遗传风险具有最优的预测效果。第二部分基于多组学的胃癌生存预测模型构建背景:具有相同临床及组织病理学特征的胃癌患者其预后可能存在很大差别,提示胃癌患者可能有很多的未知的信息隐藏在分子学指标当中,如:遗传变异、基因表达和甲基化状态等。研究表明,整合临床变量和组学数据的联合模型其预测效果往往优于单独使用临床变量或单独使用组学数据的模型。但是,临床数据通常为低维数据,而组学数据多为髙维数据,由于两者维度差别较大,他们往往不能根据简单的统计学结果直接合并。方法:首先将下载的TCGA(The Cancer Genome Alats)胃癌数据随机分为训练数据集和验证数据集,样本例数比例为2:1。筛选TCGA数据库中与胃癌生存相关的临床信息、差异表达基因和甲基化位点,然盾使用直接合并(模型1)、逐步回归(模型2)、临床残差(模型3)及主成分分析(模型4a和4b)策略建立胃癌生存预测模型,并通过IBS评分(integrated Brier score)及一致性指数(Harreirs concordance index,C-index)评估模型预测效果。结果:在训练数据集中,模型1和模型2的IBS评分显著低于临床预测模型,且C-index指数显著髙于临床预测模型(P<0.001),然而在验证数据集中,模型1和模型2未得到相似结果。模型3与临床预测模型相比,无论在训练数据集中,还是在验证数据集中,其IBS评分均显著高于临床预测模型(P<0.001),其C-index指数显著低于临床预测模型(P<0.01)。模型4a与模型4b预测效果明显化于临床预测模型及其他模型(p<0.001,但模型4a的C-index指数相较于模型4b更高(p<0.001)。结论:模型1和模型2可能存在过拟合问题;模型3预测效果差于临床预测模型;模型4b相对于临床预测模型预测能为有所提升,但差于模型4a;基于组学数据降维法的模型4a具有最佳的预测效果。
其他文献
<正>要牢牢抓住组织振兴这个"牛鼻子",强化农村党组织领导核心地位和政治功能。建立农村党建公园、行道树党员管护制度、党员责任岗民宿管理员等制度。近日,随团赴浙江省湖州
作为工程地质勘察的重要手段,物探方法具有高准确性、高效和低成本的优点,在工程地质勘察中的应用日渐广泛。但是在实际工作当中,由于受到复杂地质条件的影响,单一的物探方法无法满足工程地质勘察的要求,综合物探方法由此发展起来。本文将简单介绍常见的物探方法及技术特点,对其在工程地质勘察中的实例应用进行分析,为相关工作者提供参考借鉴。
大量的前测和"圆的认识"课例演绎基本上把圆规定位在"画"圆的层面,表明师生只关注其工具性而忽略圆规发明与圆本质的必然联系。本文结合对国内外各种教材的理解与剖析,紧紧抓
瘦素是由脂肪组织分泌的具有降低动物食欲、提高能量代谢效率、减少脂肪储备、增加能量消耗、减轻体重的一种激素。本文从瘦素的结构与生理特性、瘦素的生物学特征及瘦素与运
2014年2月,中华人民共和国国务院公布《社会救助暂行办法》,自2014年5月1日起施行。艾滋病群体作为特殊的社会救助对象,其相关社会救助体系一直在探索过程中;作为社会人存在,
通过过度训练和三重综合症对女性机体影响的研究,分析了过度训练与三重综合症中饮食紊乱、月经失调和骨质疏松症状的关系,探讨了它们各自的机制,为预防和治疗相关疾病提供了理论
“好花难种不长开,少年易老不重来。人生不向花前醉,花笑人生也是呆。”唐伯虎这人间极品醉美之仙、生活的美食家,总是在花前月下,约上二三知已,纵醉放歌,想想此景饮乐皆是美,吃的是
采用文献资料、问卷调查、专家访谈等方法,对西安市10所普通高校600名在校本科学生的校园体育文化生活现状进行了调查与研究,同时为西安地区普通高校大学生体育文化生活的健康
为了提高体育视频识别的准确率,加快体育视频识别的速度,提出特征筛选和支持向量机的体育视频识别模型。首先提取体育视频图像的特征,并将特征输入到支持向量机进行训练;然后
著名教育家黄炎培1936春夏到北碚考察,事后著有《北碚之游》一文。在他的笔下,从前的北碚&#39;满地是土匪,劫物掳人,变做家常便饭,简直是一片土匪世界&#39;,但经过卢作孚和同