论文部分内容阅读
可变剪切是调控基因表达和产生转录组以及蛋白质组多样性的重要机制,异常的剪切与疾病的发生有着密切的联系。研究表明,可变剪切过程会受到组蛋白修饰的调控。因此,针对不同的细胞系环境,剪切位点、可变剪切事件的精确识别,以及组蛋白修饰与可变剪切事件的相关性研究有助于揭示基因剪切及其可变剪切的调控机理。 本文以人类B淋巴细胞系(GM12878)和骨髓性白血病细胞系(K562)为研究对象,利用TopHat分别识别出135332和127167个剪切位点,比对人类基因组注释信息,构建了外显子跳跃、可变供体剪切位点和可变受体剪切位点三类可变剪切数据库。对于外显子跳跃事件的中间外显子包含/跳跃模式,在GM12878和K562中分别得到945/193和782/193个样本;对可变供体剪切位点事件的远端/近端模式,在GM12878和K562中分别得到59/83和65/97个样本;对可变受体剪切位点事件的远端/近端模式,在GM12878和K562中分别得到50/89和56/80个样本。 基于以上三种类型可变剪切事件,在两细胞系中分析了对应剪切模式的组蛋白修饰分布特征。结果显示:在中间外显子包含/跳跃模式间,H3K79me2在两细胞系中都呈现出差异性,但H3K4me2、H3K4me3、H3K9ac和H3K27ac仅在K562中有差异;在可变供体剪切位点事件的远端/近端模式间,H3K4me1在两细胞系中都呈现出差异,但H2AFZ、H3K9ac、H3K27ac、H3K79me2和H3K4me3仅在GM12878中呈现出差异性;在可变受体剪切位点事件的远端/近端模式间,H3K27ac、H3K4me2、H3K4me3在两细胞系中都呈现出差异,但H3K9ac仅在GM12878中呈现出差异,而H3K79me2仅在K562中呈现出差异。 最后,对照GM12878和K562细胞系,发现了12个相对的可变剪切模式事件,通过GO分析发现这些模式中的基因具有多种分子功能,如蛋白质激酶结合等,同时参与了诸如细胞增殖和新陈代谢等生物过程,其中CELF1基因参与了表观遗传调控。