论文部分内容阅读
前列腺癌(Prostate cancer,PCa)是现阶段常见的恶性疾病之一。PCa临床表现不明显、临床检测复杂。若发展到晚期,在治疗上也会面临巨大的挑战。目前,临床上应用的PCa检测指标存在着较多的局限性,无法满足前列腺癌准确诊断的要求。因此,筛选出精准、可靠的前列腺癌早期诊断和预后相关生物标志物的重要性不言而喻。近年来,高通量测序技术在生物医学领域高速发展,是生命科学研究中非常重要的工具,并产生了大规模的生物医学大数据。R语言和生物信息学技术等广泛应用于数据挖掘与剖析的研究中,为癌症领域的研究提供了有用的科研资料。在本研究中,主要以基因表达综合数据库(Gene Expression Omnibus,GEO)和肿瘤基因组图谱(The Cancer Genome Atlas,TCGA)中前列腺癌相关数据为数据来源,通过R语言以及生物信息学相关软件进行深层次挖掘,识别与前列腺癌与诊断相关潜在生物标志物以及基因预后风险评分模型的建立。随后,通过实时荧光定量PCR技术对基于大数据筛选出的前列腺癌潜在生物标志物—基因、miRNA进行实验验证。结果如下:1、基于GEO数据库中基因表达谱GSE69223,GSE3325,GSE55945以及TCGA数据库中前列腺癌相关mRNA-seq数据,用R语言筛选及鉴定前列腺癌组织和正常对照之间的差异表达基因(differentially expressed genes,DEGs)。通过数据下载、芯片质量评估、背景校正、标准化处理及数据分析,筛选出共同的上调DEGs和下调DEGs分别为312个和85个。对DEGs完成基因本体(Gene ontology,GO)、京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析。利用 Cytoscape 可视化平台解析STRING数据库生成的蛋白互作网络,共鉴定10个核心基因。在转录水平以及翻译水平上,对10个核心基因再次验证,确定其中5个核心基因可作为潜在诊断生物标志物,分别为FLNA,FLNC,VCL,ACTC1和MYLK,但不适于作为预后标志物。2、通过单变量和多变量Cox回归分析筛选预后差异基因并构建基因预后风险评分模型,构建了由BCO1,BAIAP2L2,C7,AP000844.2,ASB9,MKI67P1和TMEM272组成的预后标记。通过ROC曲线对7个预后基因组成的基因预后风险评分模型的生存预测能力进行评估,其中1年,3年,5年和10年的AUC值为0.995,0.886,0.812和0.606,表现出了较好的预测能力。3、通过R语言筛选GEO数据库中基因表达谱GSE112264以及TCGA数据库中前列腺癌相关miRNA-seq中差异表达miRNA(differentially expressedmiRNA,DEM)。通过数据下载、背景校正、标准化处理及数据分析,共鉴定出 10 个共同的上调 miRNA(hsa-miR-5706、hsa-miR-92a-3p,hsa-miR-592,hsa-miR-32-3p,hsa-miR-519a-3p,hsa-miR-106a-5p,hsa-miR-522-3p,hsa-miR-5586-5p)和 5 个共同的下调 miRNA(hsa-miR-760,hsa-miR-204-5p,hsa-miR-133b,hsa-miR-326,hsa-miR-542-5p)。蛋白互作网络结合Cytoscape可视化平台来确定分别与上调miRNA、下调miRNA相对应排名前10名的核心靶标基因。miRNA-mRNA相互作用网络发现hsa-miR-92a-3p和hsa-miR-204-5p主要调控着核心靶标基因。GO功能、KEGG通路富集分析发现这些miRNA参与了与肿瘤发生相关的过程和途径,确定hsa-miR-92a-3p和hsa-miR-204-5p可作为潜在生物标志物,但不适于预后。4、收集前列腺癌患者与健康男性的外周血、前列腺癌以及癌旁正常前列腺石蜡组织切片做预处理,提取其中总RNA,miRNA。应用实时荧光定量PCR技术验证数据库筛选获得的FLNA,FLNC,VCL,ACTC1,MYLK,hsa-miR-92a-3p和hsa-miR-204-5p的表达情况。结果显示这些潜在生物标志物在前列腺癌患者和正常对照者之间以及前列腺癌组织和癌旁之间均存在表达差异,在前列腺癌患者中hsa-miR-92a-3p表达水平显著上调,而FLNA,FLNC,VCL,ACTC1,MYLK和hsa-miR-204-5p 表达水平显著下调。