甲基化芯片数据精准扩展算法的研究及预测平台的实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:bluebluewater
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA甲基化在调控基因的表达方面具有重要作用,是表观遗传学中的重要课题。实验检测DNA甲基化水平的手段一般包括测序技术与芯片检测技术,测序技术可以获取人类全基因组CpG位点的甲基化水平,但成本高昂,手段复杂;芯片检测技术价格相对低廉,且能够得到全基因组尺度的DNA甲基化水平,是目前检测DNA甲基化水平的主要方法。主流的450K甲基化芯片的不足在于,其仅仅覆盖了人类全基因组CpG位点总数的2%。因此,采用计算方法对450K甲基化芯片数据进行扩展以获取更多CpG位点的甲基化水平成为了一大研究热点。目前的450K甲基化芯片数据扩展方法均属于开发通用化的扩展模型,无法对特定位点的预测效果进行量化评估。为此,本文设计了一种可以精准扩展450K甲基化芯片数据的方法,对单个CpG位点建立扩展模型并开发了在线扩展平台。此外,本文还将该扩展模型应用于环状RNA的甲基化水平研究,分析了环状RNA的甲基化与癌症之间的关联。本文的具体工作如下:1、提出了一种基于位点之间甲基化水平相似性以及DNA序列组成相似性度量的450K甲基化芯片数据精准扩展算法,对单个CpG位点建立扩展模型,并通过WGBS检测数据训练和测试模型以获取模型的参数、误差和预测准确率,最终得到面向单个位点甲基化水平的精准扩展模型,其预测结果和WGBS检测结果的相关系数达到了0.93,且各项性能指标优良。与现有甲基化水平扩展模型相比,本模型可以对特定位点的预测效果进行量化评估。2、由于环状RNA覆盖的CpG位点中,仅有少量位点的甲基化水平得以检测,因此现阶段还无法系统性地分析环状RNA中的甲基化模式,本文将DNA甲基化精准扩展模型应用于环状RNA,基于扩展得到的环状RNA甲基化数据系统地分析环状RNA的甲基化概貌,并结合多组学分析方法,识别出了一些与癌症有密切关联的环状RNA,为生物学家从海量数据中挑选实验对象提供了依据。3、设计并开发了基于Django框架的DNA甲基化在线预测平台,平台具有高响应速度、高稳定性和高并发性的特点,且访问方便、使用简单,为国内外的相关科研工作者提供了一个能够在线预测特定CpG位点甲基化水平的科学工具,丰富了DNA甲基化水平的获取手段,节省了甲基化检测实验的开销。
其他文献
目的:在不同地域的较大范围内初步了解我国孕期及产后妇女家庭暴力的发生现况,分析产生家庭暴力的原因及其影响因素。方法:采用整体抽样的方法,于2004年3月~2004年9月在河南省和广
目的左氧沙星(喹诺酮类抗菌药)单用及其与磷霉素(抗生素)联用对金黄色葡萄球菌的防耐药突变浓度(MPC)的变化。方法采用琼脂二倍稀释法,测定左氧沙星、磷霉素单用及联用时,对10株甲
在城市现代化迅速推进的今天,能保存这样多的物质文化遗产,全国也不多见。织金原先是土司地区,清康熙三年(1664年)改土归流,设立平远府,以后降为平远州,属大定府。从清初到清末
【正】1941年初皖南事变发生后,国民党顽固派宣布新四军为"叛军",取消了新四军番号,并欲进攻新四军江北部队。在这一严峻形势下,毛泽东在延安代表中共中央军事委员会下达了重
为研究采石场诱发环境问题的治理方法,以某采石场为工程背景,探索了采石场导致采区采坑、固体废弃物(废渣)等地质环境问题造成的影响和治理方法,提出了边坡治理处理措施、坡底
在不同占空比的重复频率脉冲激光辐照下,数值模拟了金属材料前、后表面的温升特性和烧蚀深度变化规律,考察了材料厚度和物性的影响。模拟结果表明,材料前表面温升曲线呈齿状;
介绍了沙河酒业研制富硒白酒的生产工艺、工艺中的关键点控制和酒体组合、调味方案及产品质量分析结果。结果表明,按该工艺生产的富硒白酒的硒浓度为36.5973μg/L,符合国家相
结合在并行编程实践和《并行计算》课程教学经验,分析了面向非计算机专业学生的《并行计算》课程的设计原则和目标,探索了《并行计算》课程的教学内容设计。通过基础知识与并
随着采石行业的迅速发展,采石场形成的环境问题日显突出。然而,我国目前对采石场环境问题的规范、防治的法律制度尚待完善。本文为了有效的遏止采石场对城乡环境的破坏,促进
<正>家庭暴力不仅是一个社会问题,也是一个医学和公共卫生问题,家庭暴力已日益受到各国医学界的关注。国外家庭暴力的研究始于20世纪70年代,国内家庭暴力的研究从20世纪80、9
会议