多样本核小体动态定位识别技术研究

来源 :东南大学 | 被引量 : 2次 | 上传用户:debaobei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
核小体定位是指DNA双螺旋相对于组蛋白八聚体的位置。核小体定位通过暴露和遮蔽蛋白结合位点参与基因的表达调控。核小体定位在不同环境下呈现动态变化。目前已经有方法可以实现两样本的核小体动态定位识别,但尚未有针对多样本(n≥3)的动态定位分析方法。可是,在发育、分化等诸多生物学研究中,必然会遇到多种细胞系或者多种细胞状态(n≥3)下核小体动态定位分析的情形,识别这种动态变化对于解析细胞表观调节机制具有重要意义。  本文针对多样本核小体高通量测序数据,提出了一种基于统计模型的核小体动态定位识别技术,以实现在多样本(n≥3)情形下,在单碱基分辨率下,准确识别核小体动态定位的基因组区域。  该技术(Dimnp)主要包含两个模块:核小体定位信号提取和多样本动态定位区间识别。在核小体定位信号提取模块,通过对原始的测序数据进行位移、调整片段长度、去冗余、平滑和归一化处理,最终得到适用于多样本比较的核小体信号;在多样本动态定位识别模块,以卡方检验作为统计模型,在单分辨率基础上计算差异显著性,然后对P值进行阈值过滤识别出动态定位区间。在此基础上开发了两款离线工具包,分别适用于Linux和Windows系统。  通过绘制ROC曲线、与DANPOS算法对比分析来评估Dimnp技术的可靠性和有效性。结果表明:Dimnp能够较准确的识别多个样本(n≥3)的核小体动态定位区域,其结果与DANPOS算法结果保持了较好的一致性(与DANPOS两两比较的结果合并对比)。但相比于DANPOS算法,Dimnp可以一次性分析多个核小体样本,从而更全面的识别出不同环境下核小体动态变化区域,同时Dimnp一次识别DANPOS多次两两比较的结果,大大提高了分析的效率。  应用Dimnp技术对酵母基因组核小体动态变化情形进行了分析。选取四组不同组蛋白突变的多样本酵母核小体数据,识别出每组的动态定位区域。对识别结果的进一步分析表明,动态变化区域显著集中在启动子区,且在端粒区的动态变化更明显,与动态变化区域相关的基因与特定的生物学功能相关。  综上所述,论文开发了识别多样本核小体动态位置的方法,建立了计算工具,系统评价表明方法可行且具有较好的准确性。论文为研究核小体在细胞生长、分化、环境特异响应、癌变等过程中的动态改变提供了方法和工具。
其他文献
非酒精性脂肪性肝病(non-alcoholic fatty liver disease, NAFLD)是生理(病理)的遗传环境下多种代谢失调的结果。根据病理改变,NAFLD分为(非酒精性)单纯性脂肪肝及由其演变的脂肪性
在能源紧缺、环境污染严重的现代社会,生物质作为唯一可转化为液体燃料的含碳清洁无污染可再生能源,近年来备受关注。生物质催化热解技术是制备高品质生物油和化学品的极具潜力