论文部分内容阅读
基因间的长链非编码RNA(long intergenic non-coding RNA,lincRNA)是一类长度大于200个核苷酸的不能编码蛋白质的RNA,它是哺乳动物基因组转录产物中的一类。研究表明,lincRNA在基因表达调控中发挥类“增强子”(Enhancer-like)的功能,在基因组印记、X染色体失活调控、染色质重塑等方面也发挥重要功能。目前在人类及其他物种的基因组中已发现几千个lincRNA,但是对于猪基因组的lincRNA注释以及功能研究报道较少。本研究关于猪多个组织中的lincRNA开展了以下工作:(1)猪多个组织中lincRNA的筛选及特征:从NCBI上下载猪不同组织的转录组的RNA-seq数据,利用Top Hat和Cufflinks将reads比对到参考基因组,然后进行拼装,参考已报道的其它物种lincRNA的特征,如长度、外显子数目、编码潜能以及表达量等,共筛选得到9982个转录本,然后对它们的特征进行总结。长度分布图结果显示:大多lincRNA的长度短于蛋白质编码基因;外显子数目大部分为2个,包含多个外显子的转录本较少;其编码潜力与Ensembl数据库中注释的47个lincRNA的编码潜力值的大小相差不大,都低于0,二者远低于Ensembl数据库中注释的编码蛋白质基因的编码潜力值;其表达量明显低于蛋白质编码基因。(2)新鉴定lincRNA的RT-PCR验证及3’末端的确定:通过IGV查看筛选得到的lincRNA,从中选出27个进行RT-PCR验证,以通城猪不同组织(心、肝、脾、肺、肾、背最长肌、皮下脂肪、大脑)的c DNA为模板进行扩增,结果表明26个转录本有扩增产物,然后根据RT-PCR扩增的琼脂糖凝胶电泳结果挑选PCR产物单一的20个转录本做3’RACE确定其3’末端,结果显示成功确定6个转录本的3’末端,其中一个lincRNA编码一个微肽RPL41。(3)RPL41物种间多序列比对:将RPL41核酸序列和蛋白质序列分别与人、小鼠、大鼠进行多序列比对,结果显示核酸序列一致性达到90%以上,而长度为75bp的ORF编码的RPL41氨基酸序列与其他物种RPL41氨基酸序列完全一样。通过查看该基因在猪的参考基因组中的序列发现,该基因的注释并不完全,第3外显子之后存在一段gap区,已通过3’RACE确定了该基因的第4外显子的序列;利用普通PCR扩增确定了该基因的第3内含子的序列。(4)RPL41对荧光素酶的影响:结果显示RPL41显著抑制荧光素酶的表达,它和之前有研究发现的一些发挥类“增强子”功能的lncRNA不同。(5)真核表达载体pc DNA3.1-RPL41-EGFP重组质粒的构建及融合蛋白的表达:将PRL41和EGFP构建入真核表达载体pc DNA3.1中,重组质粒转染PK-15细胞,荧光显微镜下观察绿色荧光,结果显示荧光显微镜下能观察到绿色荧光;通过Western Blot验证融合蛋白的表达,结果显示融合蛋白表达,表明RPL41能编码微肽。(6)超表达及干扰RPL41以后差异表达基因的分析:对从SRA数据库中下载的研究猪驯化的数据分析共有3421个差异表达基因,发现RPL41在家猪中的表达量显著高于野猪。在PK-15细胞中超表达及干扰RPL41后进行二代测序,发现共有618个差异表达基因,GO分析发现这些差异表达基因部分与转录相关。两组数据中共有的差异表达基因是60个,选3个基因进行Q-PCR验证,结果与RNA-Seq测序得到的表达量结果基本一致。本研究建立了利用猪多个组织的RNA-Seq数据鉴定lincRNA的生物信息学流程,对鉴定到的lincRNA特征进行了分析总结,并通过RT-PCR和3’RACE实验初步验证了lincRNA表达特征;从中鉴定到一个编码微肽RPL41的lincRNA,通过GO分析和实验初步验证了其功能。研究结果将丰富猪基因组的功能注释,为今后猪lincRNA及微肽基因的鉴定与功能研究提供参考。