论文部分内容阅读
地黄为玄参科多年生草本植物,是我国著名的道地药材四大怀药之一,用药历史悠久、药用价值显著。然而,地黄生产中却存在着严重的连作障碍问题,严重影响其产量和品质。如何解决地黄的连作障碍问题,已成为中药材生产可持续发展亟待解决的难题。前期研究发现以类似 mRNAs 形式转录的 lncRNAs(mRNAs like long non-coding RNAs,mlncRNAs)参与了地黄对连作毒害的感知和响应过程。但在植物的生命活动过程中,lncRNAs转录和形成主要以“非polyA”的形式存在,常规转录组建库的方法不能检测到植物体内特异响应lncRNAs。为了全面探索lncRNAs在地黄连作毒害形成过程中所扮演的“角色”,阐明连作毒害发生的分子调控网络,本研究以连作与头茬地黄的根系为材料,构建了连作(SP)和头茬(FP)地黄“非polyA”转录组文库和地黄lncRNAs序列候选集,详细分析了 lncRNAs种类及在地黄生命活动过程中的调控功能;同时,结合RACE和基因组步移技术克隆了 lncRNAs的转录本全长及其启动子序列,确证了候选lncRNAs存在的真实性。以此为基础,构建了连作和头茬地黄lncRNAs差异表达谱,筛选出了响应连作的特异lncRNAs,并鉴定了差异lncRNAs在地黄连作毒害过程中调控的目标基因。并通过qRT-PCR详细分析了连作特异响应lncRNAs及其调控目标基因(mRNAs)的表达模式,系统阐明了 lncRNAs在地黄连作毒害中所起的重要作用。本研究主要结果如下:1.连作和头茬地黄“非polyA”转录组文库的构建。分别对连作和头茬地黄中“带polyA”的RNAs和rRNAs序列进行过滤,保留了“非polyA”转录本的信息,在此基础上构建了“非polyA”转录组文库,并进行高通量测序。结果在2个文库中分别获取了 34,427,634条和47,558,986条原始reads。通过Trinity软件对“非polyA”转录本文库进行合并拼接后获得了 88,951 条 unigenes序列,序列平均长度594 bp。为了去除“非polyA”转录本文库中的编码基因序列,用BLAST和ESTscan软件,对所有的ungenes序列进行CDS预测,结果有25,944条序列被鉴定出含有明显的CDS编码区。同时,用课题组前期已构建的地黄mRNAs转录组的编码区序列作为训练集,对“非polyA”转录本文库剩余序列进行潜在编码蛋白序列预测,结果有6,302条序列被鉴定为推定的编码序列。此外,利用BLAST搜索Rfam非编码数据库,从“非polyA”文库中,进一步移除了 1,179条管家非编码RNAs序列,最终保留的55,526条unigenes作为地黄候选的lncRNAs序列集。地黄lncRNAs候选序列集的建立为进一步研究lncRNAs在地黄生命活动过程中的作用提供了基础数据。2.地黄lncRNAs分类及其调控功能解析。结合前期已经构建的地黄mRNAs转录组文库、sRNAs文库及降解组文库等地黄现有的遗传信息基础,利用生物信息学方法对lncRNAs进行了初步的功能分类,同时,从转录后水平上初步鉴定了不同的lncRNAs功能模式。结果根据地黄lncRNAs调控mRNAs靶基因模式,本研究鉴定了以下3种类型lncRNAs。(1)利用RNAfold等生物信息学软件对能够产生miRNAs的lncRNAs进行了鉴定,并获得了 317条此类lncRNAs序列。(2)分别在lncRNAs和编码mRNAs的库中,鉴定地黄保守miRNAs的编码和非编码靶基因。获取了 155条竞争性lncRNAs(mRNAs和lncRNAs都可以作为miRNAs的靶基因时,此类lncRNAs称为竞争性lncRNAs)。结果获得了 155条竞争性lncRNAs。(3)基于lncRNAs与目标mRNAs序列间的结合效率和结合自由能,利用BLASTN和lncRNAsTar软件,进一步筛选预测了 12,961条能够直接调控mRNAs的lncRNAs。由于地黄基因组未知,无法鉴定出其他类型的lncRNAs,最终把剩余的42,093条unigenes归类为其它类型的lncRNAs。基于课题组前期已构建的降解组文库,利用CleaveLand v4.0软件对作为miRNAs前体的lncRNAs进行靶基因鉴定,结果发现,有92条lncRNAs调控的135条靶基因。同时,鉴定出114条lncRNAs能与214条靶基因竞争95条miRNAs。此外,鉴定了 12,961条lncRNAs能够直接靶向12,961条mRNAs。通过对以上三种类型lncRNAs的靶基因mRNAs功能分析,发现lncRNAs参与了地黄根部发育的多种生命活动过程。3.代表性lncRNAs的转录本全长获取、启动子克隆及分析。为确证候选的lncRNAs为非编码RNAs,并验证其本身转录调控规律,本研究随机选择了8条lncRNAs,利用RACE克隆技术获得了 8条lncRNAs全长转录本序列。同时,为确证这8条lncRNAs不具有编码蛋白的功能,利用ORF finder软件对这些lncRNAs全长转录本序列进行了 ORF框预测,其结果分析发现,这8条lncRNAs的所有ORF框RNA的长度均小于300 bp,具有典型lncRNAs的特征。为进一步分析鉴定lncRNAs启动子特征和自身的调控规律,利用基因组步移技术对4条lncRNAs两侧的侧冀序列进行延伸。结果4条lncRNAs在基因组上的全长被完整获取;进一步对启动子分析,发现这4条lncRNAs启动子均含有与逆境相关的AP2、SP1、TFIID等调控元件。此外,共同比较4条lnRNAs全长转录本与基因组DNA序列,发现这4条lncRNAs均无内含子序列。4条lncRNAs的转录本序列克隆及启动子分析,为进一步深入研究lncRNAs的调控功能提供了基础信息。4.响应连作毒害关键lncRNAs的鉴定和功能研究。通过对连作与头茬地黄根部lncRNAs表达谱进行差异分析,结果共筛选了 764条差异表达的lncRNAs,其中,在连作地黄中上调的有490条,下调有274条。具体而言,作为miRNAs前体的差异lncRNAs共14条,11条在连作地黄中上调表达,3条下调表达。与mRNAs具有竞争关系的lncRNAs差异表达的共32条,在连作地黄中上调有19条,下调有13条。直接调控目标基因的lncRNAs差异表达的共223条,在连作地黄中有160条上调表达,63条下调表达。为了探索差异lncRNAs靶基因的调控模式,利用qRT-PCR方法对其中的12条关键lncRNAs及靶基因进行表达分析。结果发现,lncRNAs深度参了与连作障碍的形成和发生。即:连作上调lncRNAs促进或抑制了关键的靶基因mRNAs的表达,由此改变了地黄体内基因表达的程序,引起了地黄根部发育受阻,导致连作毒害的发生。总之,本研究首次构建了地黄“非polyA”转录组文库,候选了lncRNAs序列,补充了地黄的遗传信息数据。同时,本研究筛选了响应地黄连作的候选lncRNAs序列,并分析了关键lncRNAs在地黄连作毒害中的重要作用与功能,初步阐明了 lncRNAs在地黄连作障碍的分子调控机制,为揭示地黄连作障碍形成的分子机理和消减技术的开发提供理论依据和技术支撑。