论文部分内容阅读
目的: 本研究利用基于RNA-seq的二代测序技术检测分析人巨细胞病毒(humancytomegalovirus,HCMV)潜伏感染的人白血病单核细胞(THP-1)转录组中mRNA和长链非编码RNA(long non-coding RNA,lncRNA)的表达,并构建编码-非编码基因的调控网络模型,为进一步研究mRNA和lncRNA在HCMV潜伏感染中的作用提供实验依据。 方法: 1.分别提取HCMV潜伏感染THP-1细胞组和THP-1细胞对照组的总RNA,经RNA质量检测合格后建立cDNA文库,用Illumina HiSeqTM2000测序仪双端测序(Pair-end sequencing,PE)得到原始序列数据。将2个转录组测序样本,用TopHat回贴人类参考基因组(hg19[UCSC:http://genome.ucsc.edu]),运用Cuffiinks构建转录本。运用Blast与Refseq、NONCODE等数据库进行比对,识别出已知的mRNA和lncRNA。经鉴定的所有转录本通过CNCI(CodingNoncoding Index)进行编码能力分析,筛选出新的长链非编码RNA。 2.运用RPKM(reads per kilo bases per million reads)法分别计算mRNA和lncRNA的表达量,筛选出两样本中有差异表达的mRNA和lncRNA。 3.利用人类基因的GO(Gene Ontology)功能注释,对差异表达的mRNA进行GO功能显著性富集分析。 4.基于最新的KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库,对差异表达的mRNA进行生物学途径分析(Pathway analysis)。 5.构建出编码-非编码基因共表达网络模型(coding-non-coding geneco-expression network),预测lncRNA与mRNA之间的相互关联作用,初步预测lncRNA功能。 6.运用qRT-PCR技术验证RNA-seq所得部分差异表达的mRNA和lncRNA,验证测序结果的可信性。 结果: 1.经RNA-seq测序分析,HCMV潜伏感染组和对照组中分别获得83921512条和85087112条reads,构建出180616条转录本,包括12952条的蛋白编码基因和1354条非编码基因,得到2107条可信的新的lncRNA。 2.本实验共筛选出差异表达的mRNA2153条,其中1099条上调,1054条下调;差异表达已知的lncRNA共626条,298条上调,328条下调;差异表达新的lncRNA共969条,其中470条上调,499条下调。 3.通过GO分析提示,在生物学进程(ontology: biological process)中:细胞凋亡、细胞周期、细胞增殖、DNA组装以及炎症反应等过程存在差异;细胞组件(ontology:cellular component)中:细胞质、细胞核、蛋白质-DNA复合体、细胞器以及细胞膜等方面存在差异;分子功能(ontology: molecular function)中:蛋白结合、转录抑制活性、以及肽酶激活剂活性等方面有所不同。 4.KEGG pathway分析提示有15条信号通路显著富集,主要为MAPK、凋亡、p53等信号通路。 5.得到了一个以lncRNA MIR181A1HG为中心,69个mRNA,4个noncodingRNA相关联的共表达子网络,初步预测其功能与细胞分化有关。 6.经qRT-PCR验证的7条mRNA和7条lncRNA趋势与RNA-seq结果吻合。 结论: 本研究通过RNA-seq技术得到新的lncRNA2107条,差异表达的mRNA2153条,lncRNA1595条;差异表达的mRNA在生物学进程方面主要和细胞凋亡、细胞周期和炎症反应等有关,大部分参与MAPK、凋亡、p53等信号通路;测序结果提示HCMV感染可能通过抑制宿主细胞凋亡、消弱宿主免疫反应、抑制宿主细胞周期来维持HCMV长期潜伏感染的状态;初步预测了一条lncRNAMIR181A1HG的功能可能与细胞分化有关。