论文部分内容阅读
目的:筛选并验证结直肠癌相关lnc RNA和m RNA表达谱同时进行初步生物信息学分析。方法:1.lncRNA芯片杂交与数据提取:选取5对结直肠癌组织,提取RNA,质量检测合格后,合成c DNA、纯化标记,标记效率检测合格后,进行芯片杂交,芯片扫描、图像数字转换、数据归一化处理,设置fold change≥2为筛选标准,获得lnc RNA和m RNA差异表达谱。2.q RT-PCR验证芯片结果的可靠性:选取变化倍数较大并且在基因座中相对位置为intronic antisense、natural antisense或bidirectional的6个lnc RNAs(2个上调的lnc RNAs:ENST00000421055、ENST00000441270;4个下调的lnc RNAs:uc003hws.1、ENST00000565575、ENST00000563660、NR040058)进行SYGB Green I q RT-PCR检测,并用GAPDH做内参照。3.差异表达m RNAs集合的GO分析:GO分类依据Gene Ontology(www.geneontolo gy.org),分为基因的生物学进程、细胞组件和分子功能,GO功能的显著程度用P值表示,P值越小,功能富集程度越显著(P<0.05有统计学意义)。4.差异表达m RNAs集合的KEGG分析:生物学途经分析基于KEGG数据库(Kyoto Encyclopedia of Genes and Genomes,http://www.genome.jp/kegg),KEGG生物学途径的富集程度用P值表示,P值越小,生物学富集途径越显著(P<0.05有统计学意义)。结果:1.lncRNA与mRNA差异表达谱:差异表达lncRNAs共有11724个(上调4908个lnc RNAs,下调6816个lnc RNAs),差异表达m RNAs共有7339个(上调3860个m RNAs,下调3479个m RNAs)。2.q RT-PCR验证芯片结果的可靠性:GAPDH、ENST00000421055、ENST00000441270、uc003hws.1、ENST00000565575、ENST00000563660、NR040058的PCR反应均呈特异性扩增,2-△△CT法计算其在5对结直肠癌组织中的表达结果与芯片检测结果一致。3.差异表达m RNAs集合的GO分析:差异表达的m RNAs集合主要富集在20个细胞生物学进程、20个细胞组件和20个分子功能中,上调m RNAs集合富集度最高的生物学进程是mitotic cell cycle,含有m RNAs210个,富集度最高的细胞组件是cytosol,含有m RNAs508个,富集度最高的分子功能是protein binding,含有m RNAs1386个;下调m RNAs集合富集度最高的生物学进程是multicellular o rganismal process,含有m RNAs962个,富集度最高的细胞组件是extracellul ar region,含有m RNAs421个,富集度最高的分子功能是actin binding,含有m RNAs81个。4.差异表达m RNAs集合的KEGG分析:差异表达的m RNAs集合主要富集在20条信号通路中。上调m RNAs集合富集度最高的生物学通路是Cell cycle(human),含有m RNAs124个,下调m RNAs集合富集度最高的生物学通路是Systemic lupus erythematosus(human),含有m RNAs137个。结论:1.获得结直肠癌相关lnc RNAs和m RNAs差异表达谱:通过lnc RNA芯片技术获得了11724个lnc RNAs和7339个m RNAs。2.q RT-PCR验证芯片结果的可靠性:运用SYGB Green I q RT-PCR检测ENST00000421055、ENST00000441270、uc003hws.1、ENST00000565575、ENST00000563660、NR040058在5对结直肠癌组织中的表达结果与芯片检测结果一致,证明了芯片检测结果可靠。3.差异表达m RNAs集合的GO分析及KEGG分析:GO分析显示:差异表达的m RNAs集合主要富集在20个细胞生物学进程、20个细胞组件及20个分子功能中,KEG G分析显示:差异表达的m RNAs集合主要富集在20条信号通路中,研究与结直肠癌相关的m RNAs,有望发现更多作为潜在诊断标志物和治疗靶点的lnc RNAs。