论文部分内容阅读
目的:本研究通过生物信息学探索膀胱癌发生发展过程中的核心基因、生物标志物及潜在治疗的小分子药物。方法:从TCGA(The Cancer Genome Atlas)数据库下载膀胱癌m RNA表达谱数据及临床数据,并从GEO(Gene Expression Omnibus)数据库下载膀胱癌高通量测序表达谱数据集GSE133624,利用R软件limma包进行差异基因(Differentially expressed genes,DEGs)分析。通过Venn Diagram包对两个数据集的差异DEGs取交集并进行可视化,对交集的DEGs进行功能富集分析(Gene Ontology,GO;Kyoto Encyclopedia of Genes and Genomes,KEGG)寻找潜在的作用机制。利用STRING数据库构建蛋白互作网络,然后通过Cytoscape3.8.0软件中的cyto Hubba插件筛选核心基因后进行生存分析和相关性分析,利用Oncomine肿瘤数据库对其m RNA表达水平进行验证。最后使用CMap数据库探索膀胱癌潜在治疗的小分子药物并通过Pub Chem数据库对其结构及分子式予以展示。结果:差异基因分析共获得777个DEGs,包括194个上调基因,583个下调基因。GO分析表明,DEGs参与细胞外基质组织、细胞外结构组织、细胞器裂变、核分裂、肌肉系统过程的调节、轴突生成、涉及有丝分裂的微管细胞骨架组织、染色体分离的调节、纺锤体组装等生物过程。KEGG分析表明,DEGs主要通过血管平滑肌收缩、钙信号通路、细胞周期、c GMP-PKG信号通路、细胞粘附分子、ECM-受体相互作用、PI3K-Akt信号通路、Apelin信号通路等调控膀胱癌的进展。此外,筛选出7个与预后显著相关的核心基因(ANLN、CCNB1、CDC20、CTSV、OIP5、IGF1和PLK1),这些基因之间具有显著的相关性。最后还筛选了5个潜在膀胱癌治疗的小分子药物,包括酚苄明(phenoxybenzamine)、曲古菌素A(trichostatin A)、芹菜素(apigenin)、吲哚酮(GW-8510)和硫基鸟嘌呤(thioguanosine)。结论:本研究结果表明,ANLN、CCNB1、CDC20、CTSV、OIP5、IGF1和PLK1与膀胱癌患者的预后显著相关,其可作为膀胱癌早期诊断和改善预后的标志物以及治疗的分子靶点。c GMP-PKG、PI3K-Akt、Apelin等信号通路在膀胱癌的发生发展中起着关键作用。此外,酚苄明、曲古菌素A、芹菜素、吲哚酮和硫基鸟嘌呤可能是膀胱癌治疗的潜在药物。目的:本研究旨在探讨CTSV(cathepsin V)在膀胱癌中的表达水平及临床意义,构建nomogram预后模型并对其效能进行评价,探究该模型对制定临床治疗方案的指导意义。方法:基于第一部分研究结果,选择CTSV作为靶基因进行本部分的研究。基于TCGA数据库评估膀胱癌组织和癌旁组织中CTSV的表达水平,并利用GEPIA在线数据库、GSE13507数据集、Oncomine数据库以及膀胱癌组织对其表达进行验证。使用Wilcoxon符号秩检验分析CTSV与临床病理特征的相关性。根据CTSV表达的cutoff值(基于R软件中survminer包)将膀胱癌患者分为高表达组和低表达组,并利用logistic回归分析CTSV表达水平与临床病理变量的相关性。使用Kaplan–Meier生存分析比较高CTSV组和低CTSV组间的总生存率。使用Pearson检验分析CTSV与其他预后相关核心基因的相关性。使用STRING数据库构建了一个与CTSV相关的蛋白互作(Protein-protein interaction,PPI)网络,并利用GESA识别CTSV相关的信号通路。然后采用单因素和多因素Cox回归分析CTSV及临床变量与生存的关系。最后基于多因素Cox有意义的因素构建预后nomogram并对其模型进行验证及评价。结果:从TCGA数据库中获得408例膀胱癌样本和19例癌旁组织样本。结果表明,CTSV在膀胱癌中的表达显著高于癌旁组织(P<0.05),而且高表达CTSV的膀胱癌患者生存时间明显短于低表达CTSV患者(P=0.0062)。CTSV的表达量与性别(P=0.046),组织学分级(P<0.001),种族(P=0.0039)和T分期(P=0.043)显著相关。单变量logistic回归分析表明,CTSV的高表达与种族(OR=2.519 for white vs.others),组织学分级(OR=1.662 for low vs.high),临床分期(OR=1.589 for I-II vs.III-IV),状态(OR=1.435 for normal vs.tumor),T分期(OR=1.589 for T1-2 vs.T3-4)和M分期(OR=4.499 for M0 vs M1)显著相关(P<0.05)。Person相关性分析表明,ANLN(R=0.56)、CCNB1(R=0.46)、CDC20(R=0.53)、OIP5(R=0.5)和PLK1(R=0.53)与CTSV呈正相关(P<0.05),而ADCY5(R=-0.18)与CTSV呈负相关(P<0.05)。CTSV相关的PPI网络表明,CTSV与CTSL、CTSA、MMP、HLA家族等密切相关。GSEA分析结果表明,在高CTSV表达的表型中,细胞周期、肌动蛋白细胞骨架的调节、紧密连接、细胞基质粘附、Wnt信号通路、MAPK信号通路、细胞粘附分子、JAK-STAT信号通路、胰岛素信号通路等通路显著富集。多因素Cox回归分析显示,年龄(HR:1.033,95%CI:1.016-1.050,P<0.001)、T分期(HR:1.459,95%CI:1.088-1.958,P=0.012)、N分期(HR:1.433,95%CI:1.075-1.909,P=0.014)和CTSV(HR:1.495,95%CI:1.069-2.089,P=0.019)是膀胱癌患者预后的独立危险因素。基于多因素Cox回归有意义的变量构建预后nomogram,1年、3年和5年的ROC曲线下面积分别为0.729、0.701和0.709,内部验证模型的C-index为0.669(95%CI:0.624-0.714),校准曲线显示生存率预测值与实际值具有较好的校准度,决策曲线分析显示净获益率在35-80%之间都是有用的,该模型具有较好的区分度、一致性和临床实用性。结论:本研究结果表明,CTSV在膀胱癌组织中的表达显著高于癌旁组织,并且CTSV高表达的膀胱癌患者预后更差。高表达的CTSV与晚期临床病理特征显著相关,如病理分级(高级别)、临床分期(III-IV)、T分期(T3-T4)和M分期(M1)。年龄、T分期、N分期和CTSV为影响膀胱癌患者生存的独立危险因素。预后预测nomogram模型具有较好的区分度、校准度和临床效能。