论文部分内容阅读
口腔鳞状细胞癌是口腔颌面部最常见的恶性肿瘤。它具有恶性程度高,淋巴结易转移,预后差等特点。从分子水平研究口腔鳞状细胞癌的发生发展,对于口腔鳞状细胞癌的预防、控制和治疗具有重要意义。生物信息学是一门交叉学科。它整合了信息学、统计学和计算机学等多种技术分析海量生物数据所包含的信息。它先对生物芯片的海量数据进行筛选,再采用序列比对、统计分析、生物聚类、通路分析、可视化作图等方式,进行数据挖掘,从而对疾病从分子水平进行分析,丰富对疾病进展的认识。随着生物信息学的发展,形成了新的生物学研究模式,即利用现有的数据信息,先作理论推测,再行实验验证。本研究课题以GEO及TCGA数据库为研究基础,采用BRB-ArrayTools软件分别筛选口腔鳞状细胞癌中差异表达的基因、microRNA及lncRNA,联合生物信息软件和文献挖掘等方法对他们之间相互作用关系进行分析,从而探索与口腔鳞状细胞癌相关的基因、microRNA及lncRNA,为更好地理解口腔鳞状细胞癌发生、发展的分子机制提供重要的信息,为进一步研究口腔鳞状细胞癌的发生、发展提供新的方向。第一部分:口腔鳞状细胞癌差异表达基因的生物信息学分析研究背景:口腔鳞状细胞癌是目前我国常见的肿瘤之一。我国口腔鳞状细胞癌的发病率约在3.6/10万-8.0/10万人。现已证实,口腔鳞状细胞癌是复杂的多基因疾病,环境因素和遗传因素共同参与了疾病的发生和发展。基因芯片因其具有高通量、高特异性、快速等特点,可检测基因的丰度和种类,并从整个基因组层面进行相关分析。目的:通过对多个口腔鳞状细胞癌表达芯片的生物信息学分析,筛选与该肿瘤相关的差异表达基因,对差异表达基因进行功能注释、通路分析及蛋白质互作网络分析,为探索口腔鳞状细胞癌发生、发展的分子机制提供理论基础。方法:本课题整理GEO公共数据库的基因芯片数据集,以针对口腔鳞状细胞癌目标的Affymetrix芯片表达谱数据作为研究对象,系统地分析口腔鳞状细胞癌的基因表达谱芯片数据,进行数据预处理后,选择非配对t检验统计方法筛选差异表达基因,应用DAVID软件选取GO数据库进行功能注释、KEGG数据库进行通路分析,导入STRING在线数据库绘制差异表达基因编码蛋白互作网络图,并应用Cytoscape软件计算网络及各节点的拓扑特性。结果:(1)本研究在口腔鳞状细胞癌中发现92个基因表达异常,其中表达上调的61个,表达下调的31个。(2)GO分析发现表达上调的差异表达基因主要集中在对损伤的反应、胶原代谢过程、多细胞生物大分子代谢过程等。其中参与胶原代谢过程有MMP9、MMP1、MMP10、MMP11、MMP3、MMP7等基因。KEGG通路分析发现,表达上调的差异表达基因主要集中在细胞外基质受体相互作用、黏着斑、肿瘤通路、Toller样受体通路等通路。(3)GO分析发现表达下调的差异表达基因主要集中在上皮细胞分化、上皮发育、表皮发育、外胚层发育等过程。KEGG通路分析发现,表达下调的差异表达基因主要集中在通过视黄醇的代谢、细胞色素p450外源性物质代谢、药物代谢等通路。(4)经STRING软件共筛选出35个差异表达基因编码的蛋白产物存在相互作用,构建差异表达基因互作网络图,Cytoscape软件共筛选五个关键基因,分别为MMP-9、MMP-1、 COL1A2、MMP-7、PLAU。结论:(1)成功筛选出口腔鳞状细胞癌中差异表达的92个基因,并对其进行功能注释与通路分析,为该疾病的实验室研究提供了理论基础。(2)成功构建口腔鳞状细胞癌差异表达基因的蛋白质相互作用网络,并筛选出五个关键基因,提示MMPs家族成员可能参与在口腔鳞状细胞癌发展过程,有利于进一步研究差异表达基因的相互作用关系,并为该疾病的诊断和治疗提供了研究方向。第二部分口腔鳞状细胞癌差异表达microRNA的生物信息学分析研究背景:microRNA是内源性非编码小RNA(18-25nt)的总称。microRNA通过转录后抑制基因的表达。它可以通过与靶基因mRNA的3’端非翻译区(3’-untranslationalregion,3’-UTR)结合达到抑制蛋白翻译的作用。目前发现miRNA可调节约60%的基因,且可能与多种不同的靶基因有调控关系。越来越多的研究发现,miRNA在细胞的生长、分化、增殖和调亡等重要过程发挥了重要的作用,并参与了肿瘤的发生发展过程。目的:通过整理TCGA数据库的口腔鳞状细胞癌miRNA数据,并进行生物信息学分析,探索口腔鳞状细胞癌差异表达miRNA,进一步研究其靶基因的作用。方法:本研究利用BRB-ArrayTools对来自TCGA数据库的口腔鳞状细胞癌miRNA进行分析,得到差异表达miRNA;通过miRecords预测差异miRNA的靶基因,对差异靶基因进行GO功能注释、KEGG通路分析,应用STRING在线数据库绘制靶基因编码蛋白互作网络图,并应用Cytoscape软件计算网络及各节点的拓扑特性。结果:(1)采用BRB-ArrayTools分析TCGA数据集中miRNA表达谱的数据,我们发现了53个显著差异的miRNA。(2)针对差异靶基因的GO功能注释发现,差异表达的靶基因参与细胞增殖的调节、内源性刺激应答、有机物质应答、激素刺激应答等功能。(3)KEGG通路分析中,差异表达靶基因主要参与了细胞因子及其受体的相互作用、MAPK信号通路、Wnt信号通路、Jak-STAT信号通路。(4)经STRING软件在线数据库分析共筛选出73个差异表达microRNA的靶基因存在相互作用,构建靶基因编码蛋白互作网络图;Cytoscape软件共筛选出十二个关键靶基因,分别为STAT3, CCND1, PTGS2, IL8, PPARG, ERBB2, MMP2, PLAU, FGF1, CASP3, FASLG和IL10.结论:(1)成功筛选口腔鳞状细胞癌中差异表达的microRNA。其中,miR-375可能是口腔鳞状细胞癌分子标志物。miR-21、miR-101、let-7c和mir-200c表达异常为研究口腔鳞状细胞癌EMT过程提供了生物信息学证据。(2)差异表达microRNA的靶基因主要参与细胞增殖的调节、内源性刺激应答、有机物质应答、激素刺激应答等功能。(3)差异表达microRNA的靶基因主要参与了细胞因子及其受体的相互作用、MAPK信号通路、Wnt信号通路、Jak-STAT信号通路。(4)成功构建差异表达microRNA对应靶基因的蛋白质相互作用网络图,并筛选出12个关键靶基因。第三部分口腔鳞状细胞癌差异表达长链非编码RNA的生物信息学分析研究背景:长链非编码RNA (long non-coding RNA, lncRNA)因其在生物基因调控方面的潜在巨大作用,在近几年获得广泛关注。研究显示长链非编码RNA和疾病发生及发展进程相关,但是其发挥作用的具体机制尚不十分清楚。目前lncRNA在口腔鳞状细胞癌中作用及机制知之甚少。目的:本研究拟通过生物信息学的方法,分析GEO数据库中的口腔鳞状细胞癌数据,探索口腔鳞状细胞癌中的差异表达lncRNA,为后续研究lncRNA在口腔鳞状细胞癌中的作用机制提供了新的思路。方法:本研究利用BRB-ArrayTools对GEO数据库的口腔鳞状细胞癌数据集进行分析,筛选得到差异lncRNA。结果:本部分研究发现,与正常组织相比,口腔鳞状细胞癌17个lncRNA的表达出现差异。其中表达上调的有4个,表达下调的有13个。H19在口腔鳞状细胞癌中表达显著下调。结论:(1)成功筛选出口腔鳞状细胞癌中差异表达的lncRNA17个,为进一步研究lncRNA在该疾病中的作用提供了方向。(2)LncRNA H19在口腔鳞状细胞癌中表达下调,提示其可能与mir-200家族作用,调控了口腔鳞状细胞癌上皮-间质转变(EMT)的生物学过程。