面向基因表达调控的组蛋白修饰网络构建方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:boyhill
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着上千种生物基因组测序工作的完成和研究者们对于基因组功能研究的不断深入,人类对于生命的认知已经进入了后基因组时代。探索基因表达的调控方式已经成为当下科研工作者的重要任务。  真核生物的基因组包裹在核小体上,形成一种染色质结构。核小体上可以添加多种组蛋白修饰,同时,组蛋白修饰间存在着相互作用关系,这些相互作用关系可以通过调节部分组蛋白修饰间接地影响基因表达。以往的研究工作主要集中在分析基因启动子区域组蛋白修饰对基因表达的影响以及组蛋白修饰间的相互作用关系,而对于转录延长区域组蛋白修饰的研究比较缺乏。逐渐积累的证据表明该区域上组蛋白修饰可以调节转录延长以及RNA剪切等,这些过程也是基因表达调控中重要的组成部分。本文利用计算的方法构建了转录延长区域上组蛋白修饰与RNA剪切之间的调控网络,从而找出可以调节RNA剪切的组蛋白修饰以及组蛋白修饰间的相互作用关系。本文的主要内容包括:  (1)提出了基于转录延长区域组蛋白修饰的外显子表达水平预测模型。  本文首先从计算的角度分析了转录延长区域组蛋白修饰对基因表达以及外显子剪切的调节作用,论证了构建转录延长区域组蛋白修饰与外显子剪切间调控网络的基础条件。本文提出了基于转录延长区域组蛋白修饰预测外显子表达水平的线性回归模型,并基于该模型系统地分析了转录延长区域组蛋白修饰与外显子表达水平之间的关系。本文得到以下三方面结论:1)证实了该区域上组蛋白修饰和基因表达水平及外显子表达水平间存在着良好的定量关系,表明该区域组蛋白修饰可能调节基因表达和外显子剪切;2)说明不是所有组蛋白修饰都与外显子表达之间存在调控联系;3)我们的结果说明以上的定量模型在不同的外显子类型间甚至不同的细胞类型间都具有通用性。  (2)提出了从染色质结构角度寻找pre-miRNA剪切机制的定位信息。  本文利用统计学方法系统地分析了pre-miRNA序列上的染色质结构特征,本文的分析结果表明表观信息也可能调节miRNA的剪切。以往的研究工作主要集中在分析DNA序列对miRNA剪切的影响,而对表观信息在miRNA剪切中的作用了解较少。本文的结果显示在pre-miRNA序列上存在着核小体、组蛋白修饰( H2BK5me1、H3K36me3和H4K20me1)以及RNAPII的明显富集。本文的研究结果揭示了pre-miRNA序列上的染色质结构特征,并表明了一种可能的pre-miRNA剪切机制,该机制通过RNAPII将DNA水平和 RNA水平连接起来,并能够识别染色质结构特征,从而促进pre-miRNA剪切。  (3)构建了外显子区域上组蛋白修饰调控网络。  在以上工作的基础上,为了更明确地找到调节RNA剪切的组蛋白修饰以及组蛋白修饰间的相互作用关系,本文构建了外显子区域上组蛋白修饰和选择性剪切外显子表达水平间的调控网络。在启动子区域,已有一些研究工作利用基于聚类的贝叶斯网络方法来发现组蛋白修饰与基因表达之间的调控关系。在方法上,本文利用偏相关系数来发现调控关系,一方面,避免了聚类造成的信息丢失和不同的聚类过程导致的网络结构不稳定性,另一方面,偏相关系数可以从选择性剪切外显子的表达水平中有效地剔除掉基因表达水平的影响,更有利于发现组蛋白修饰与选择性剪切事件之间的联系。本文将该方法应用到了人类CD4+T细胞的全基因组组蛋白修饰高通量ChIP-seq数据和RNA-seq数据上,预测出外显子区域上组蛋白修饰之间的相互作用关系以及组蛋白修饰与选择性剪切事件之间的调控关系。多种相关生物学实验结果以及相关分析验证了本文预测结果的正确性和本文方法的有效性。  (4)提出了组蛋白修饰非稳态调控网络的构建方法。  为了进一步比较外显子区域与其它基因组功能元件上组蛋白修饰调控关系间的差别,本文提出了一种非稳态调控网络的构建方法,该方法能够自动地确定基因组上功能元件的边界,并同时发现不同功能元件上组蛋白修饰之间的调控关系。本文将该方法应用到了人类CD4+T细胞中的全基因组组蛋白修饰高通量ChIP-seq数据上,预测出多种基因组功能元件上不同的组蛋白修饰间调控关系。不同角度的分析以及多种相关生物学实验结果都验证了预测结果的正确性。
其他文献
无线Mesh网是一种多跳、高速率、大容量的新型无线网络结构。它融合了无线局域网和移动Ad hoc网络的特征,是“最后一公里”宽带理想的接入方案。作为下一代无线通信网络宽带理
特征提取是模式识别所研究的关键问题之一,其基本任务是寻求对分类尽可能有效的特征。在监督的特征提取方法中,线性判别分析(LDA)具有代表性,并已在人脸识别、文本分类、信息检索
基于三维人体运动数据的情感识别是一个崭新的人体运动学与模式识别的交叉课题,该技术的研究目前尚处于起步阶段。本文对该技术进行了深入的探索与研究,包括人体运动建模、Peri
数字化、高清晰度、可连接网络、自带操作系统的智能电视成为了下一代电视的发展趋势。虽然智能电视与传统电视有许许多多的不同,但智能电视在提供新功能的同时也需要支持传统
随着电子政务信息化进程的推进,电子政务的优势凸显,对比传统政务方式,工作效率有了极大的提高,但是因为初期建设时缺乏统一规划,各个业务系统间不能相互沟通交流,形成了一个个的“
互联网中海量的非结构化信息包含丰富的语义内容,对其进行语义分析具有重要的意义。语义分析的对象主要有文字、图像和图像中的文字。微博是当前流行的社交网络,其中包含大量的
近年来,从海量数据中学习出数据的潜在特征层次已成为机器学习领域中的热点,深度学习就是旨在解决这一问题的一种无监督学习方法。随着深度学习的广泛应用,其构成基础——玻尔兹
启动子序列模式的建模与发现是基因表达与调控组织特异性模式发现的核心。研究表明,综合多个模式发现工具的结果覆盖度较高,但是需要消除冗余。目前,在消除模式冗余中缺乏变长模
随着信息技术和网络技术的迅速发展,各类复杂系统的规模和复杂程度也在急剧增大,用MAS(Multi-Agent System,MAS)的理论和技术研究其网络结构和信息传播现象引起越来越多的关注和
随着计算机系统规模的迅速增大,系统设计实现的正确性问题越来越严峻。形式化方法的出现,成为了解决该问题的一个重要手段。它运用数学方法的特点相比于传统的模拟和测试具有更