论文部分内容阅读
背景:口腔癌是世界上最常见的恶性肿瘤之一,其中口腔鳞状细胞癌(oral squamous cell carcinoma,OSCC)在口腔癌中最常见。据统计口腔癌患者在世界常见男性癌症中排名第八,在女性癌症中排名第十四。针对OSCC的主要治疗方法有手术,放疗和化疗等。有约一半患者在被诊断为OSCC时已出现转移,而肿瘤的转移正是产生不良预后的重要因素之一。近几十年来,OSCC患者的生存率以及预后情况仍无显著提升。因此探索可预测OSCC预后的生物标志物具有十分重要的意义,将有利于个体化治疗的发展,并提供潜在的治疗靶点。长链非编码RNA(long non-coding RNA,lnc RNA)已被证实在多种肿瘤发生过程中起到重要作用,参与促进或抑制肿瘤的发生。有研究表明多种lnc RNAs在OSCC中表达异常,并在肿瘤的转移侵袭等过程中起到作用。由此可见,lnc RNA作为肿瘤的生物标志物具有十分重要的意义,将有利于癌症的治疗与预后。虽然在OSCC中已经开展了大量关于lnc RNA的研究,但目前仍缺乏有效的生物标志物来对OSCC患者的预后进行预测。目的:本研究以TCGA(The Cancer Genome Atlas)数据库为基础,利用生物信息学方法,寻找可信lnc RNA作为对OSCC患者预后进行预测的生物标志物,并通过q PCR法检测lnc RNA在OSCC患者癌组织及癌旁组织的表达情况。构建差异表达lnc RNAs(DElnc RNAs)与差异表达的蛋白编码RNA(DEpc RNAs)共表达网络,筛选出OSCC潜在诊疗靶点。方法:本研究从TCGA数据库中下载OSCC的RNA表达谱数据及相应的临床资料。通过分析处理,筛选出在癌组织与正常组织中的DElnc RNAs和DEpc RNAs。使用R包pheatmap绘制热图和火山图对DElnc RNAs进行可视化。采用perl脚本工具提取生存数据,将临床数据与DElnc RNAs的表达合并,利用R软件包univariate R建立单变量Cox回归模型。使用单变量Cox回归分析中的DElnc RNAs(P<0.01)来构建多变量Cox回归模型,计算模型的风险比(HR)和95%置信区间(CI),根据风险分值中位数将患者分为高危组和低危组。为了对Cox回归模型的预测能力进行评估,绘制受试者操作特性(receiver operating characteristic,ROC)曲线并计算ROC曲线下面积(area under ROC,AUC)及计算C指数(Concordance index)。经过多变量Cox回归分析筛选出的DElnc RNAs使用R包survival绘制Kaplan-Meier生存曲线进行生存分析,最后确定的几个lnc RNAs将成为预测OSCC患者预后的生物标志物。使用q PCR在临床样本中对最终选出的lnc RNAs表达进行检测,并进行靶基因预测及功能富集分析。最后利用WGCNA方法建立DElnc RNAs与DEpc RNAs共表达网络,选出OSCC潜在的诊疗靶点。结果:(1)从TCGA数据库中下载有关OSCC的数据包括19例正常组织和261例肿瘤组织。共筛选出1296个DElnc RNAs,其中916个lnc RNAs上调,380个lnc RNAs下调。(2)通过单变量Cox回归分析,筛选出44个具有显著性的DElnc RNAs(P<0.05)。其中27个DElnc RNAs是低风险的,14个DElnc RNAs是高风险的。选择P<0.01的5个DElnc RNAs来构建多变量Cox回归模型。ROC曲线下面积(AUC)为0.728,C指数为0.64,证明该模型是可信的。通过多变量Cox回归分析,4个DElnc RNAs被认为是预测OSCC患者生存时间的候选生物标志物。(3)通过Kaplan-Meier法对4种候选DElnc RNAs进行总体生存分析,结果表明4个候选DElnc RNAs:CDKN2A-DT、PRKG1-AS1、AC009226.1和LINC00689都与OSCC患者的生存具有显著的相关性,其中CDKN2A-DT与LINC00689为预后保护因子,而AC009226.1和PRKG1-AS1则为预后风险因子。(4)组织q PCR显示在OSCC患者癌组织中AC009226.1,CDKN2A-DT及PRKG1-AS1表达水平均高于癌旁正常组织(P<0.05),LINC00689的表达水平低于癌旁正常组织(P<0.05)。(5)对4个lnc RNAs的靶基因预测结果显示,CDKN2A-DT有2个显著正相关的靶基因,PRKG1-AS1仅有1个正相关的靶基因。AC00926.1有121个显著相关的靶基因,其中正相关基因62个,负相关基因59个。LINC000689有219个显著相关的靶基因,其中正相关基因213个,负相关基因6个。对AC009226.1的靶基因进行GO功能注释分析发现大部分基因具有丰富的DNA结合转录激活子活性、肌动蛋白依赖的ATP酶活性等。KEGG通路富集分析发现多数基因还参与了黏着斑、PI3K-Akt信号通路、Apelin信号通路等。对LINC00689的靶基因进行GO功能注释分析发现,大部分基因在金属离子跨膜转运蛋白活性、电压门控离子通道活性、钾离子通道活性等中富集。KEGG通路富集分析发现多数基因还参与了代谢通路、钙信号通路等。(6)通过WGCNA方法建立DElnc RNAs与DEpc RNAs共表达网络,对相关性高的3个模块内基因进行生存分析,结果显示5个基因AL117338.1、LCMT1-AS2、OPRPN、RSPH4A、TESC可作为OSCC潜在的诊疗靶点。结论:(1)以下4个lnc RNAs:CDKN2A-DT、PRKG1-AS1、AC009226.1和LINC00689,可作为预测OSCC患者预后的生物标志物,其中CDKN2A-DT与LINC00689为预后保护因子,而AC009226.1和PRKG1-AS1则为预后风险因子。(2)对LINC00689与AC009226.1的靶基因进行功能分析,发现在OSCC的发生发展中的多种生物学功能及信号通路中起到作用。(3)通过建立DElnc RNA与DEpc RNA共表达网络,共筛选出5个基因AL117338.1、LCMT1-AS2、OPRPN、RSPH4A、TESC可作为OSCC潜在的诊疗靶点。