论文部分内容阅读
研究背景:肺癌是我国发病率及死亡率最高的恶性肿瘤,其中非小细胞肺癌(non-small cell lung carcinomal,NSCLC)是最常见的病理类型,主要包括腺癌及鳞状细胞癌。肺癌的发生发展是伴随一系列基因表达异常的复杂的病理生理过程,特别是参与DNA损伤、细胞周期和分化的基因与癌症的发生和转移密切相关。分子生物学技术的发展促进了一大批分子靶向药物研发并已应用于临床,缓解了临床治疗的困境,但由于肺癌异质性,分子靶向药物的治疗仍有其局限性,急需要挖掘出更多的潜在标志物,为临床治疗提供更多的可选择性,以及提供有效的早期诊断及预后。生物信息学是一门新兴交叉学科,在获取基因组学、转录组学、蛋白组学等数据后,利用生物信息学的方法可以对数据进行归类、注释,进一步研究疾病发生发展的可能分子机制。随着生物信息学重要性的突出,在疾病研究中利用其进行基因表达数据的分析,为疾病诊断、治疗及设计新药提供重要依据。研究目的:本研究旨在利用生物信息学的方法,大数据挖掘NSCLC中潜在标志物,并确定目前尚未深入研究的、可作为标志物的目的基因,利用癌TCGA、GEO数据库分析目的基因在NSCLC中的表达情况及通过强互作基因及蛋白发掘目的基因可能存在的分子机制,并且通过临床样本数据进行进一步验证,以期望为NSCLC寻找早期诊断及预后判断的新标志物,为NSCLC的治疗提供新的标志物,为NSCLC分子靶向治疗及预后判断开辟一条新途径。研究方法:基于GEO数据库下载NSCLC相关数据集,利用Calculate and draw custom Venn diagrams这个在线的韦恩图绘制工具将3组数据集合并取交集,获取显著差异表达基因(Differentially expression genes,DGEs)。通过Oncomine数据库及查阅文献初步确定目前在NSCLC方面研究较少但具有意义的目的基因GINS2。基于TCGA数据库、GEO数据库分析GINS2在NSCLC中的表达及生存曲线分析,再进一步采用TCGA数据库分析GINS2互作基因。基于Genemania数据库、STRING数据库构建由DEGs编码的蛋白互作PPI网络,进一步分析GINS2可能的分子机制。收集兰大二院及解放军联勤保障部队940医院胸外科经手术切除初诊为NSCLC的新鲜的癌组织及癌旁组织,采用RT-PCR技术检测GINS2在不同分期、不同分化程度、不同病理类型的NSCLC癌组织及癌旁组织中的相对表达量,基于Graphpad Prism7软件TTest分析GINS2的表达与NSCLC临床特征的相关性。研究结果:1.基于GEO数据库对3个数据集合并取交集,共获取17个显著上调的DEGs。2.Oncomine数据库分析及查阅文献,发现GINS2在NSCLC的研究主要集中于LUSC,与性别、临床分期有相关性,在不同病理类型的表达中差异无显著统计学意义。3.基于TCGA数据库分析GINS2强互作基因有CDT1,GMNN,CENPN。基于Genemania数据库、STRING数据库构建由DEGs编码的互作蛋白有20种。4.基于TCGA数据库、GEO数据库分析及临床样本数据验证GINS2与临床特征的相关性,结果显示临床样本分析结果与TCGA大数据分析个别结果存在差异。临床样本分析示:(1)GINS2在NSCLC癌组织与癌旁组织中表达具有显著差异性(P<0.05);(2)GINS2在LUSD患者表达较LUAD患者显著上调;不同年龄阶段NSCLC患者GINS2表达具有显著差异性(P<0.05);(3)男性患者较女性患者GINS2表达上调;(4)GINS2在吸烟患者表达较非吸烟患者显著上调(P<0.05);(5)GINS2上调表达与肿瘤大小(P<0.05),淋巴结转移(p<0.05),肿瘤分期(p<0.05)均具有显著性差异。TCGA数据库分析示GINS2表达与病理类型、分期无显著相关性(P>0.05),生存曲线分析无统计学意义(P=0.78),但GEO数据库分析示生存曲线有统计学意义(P=0.0002394)。结论:1.GINS2为NSCLC新的标志物。2.采用TCGA数据库进行大数据分析及临床样本数据验证GINS2在NSCLC中的表达及意义,发现GINS2的高表达与肿瘤增殖、侵袭有关,且吸烟者及男性可能是GINS2表达上调的易感人群。3.GINS2是NSCLC潜在诊断及预后标志物,进一步研究相关药物抑制GINS2的高表达,可以为临床治疗NSCLC开辟新的治疗途径,为进一步提高NSCLC患者疗效、延长生存期,改善预后具有重要临床意义。