利用计算方法研究疾病突变的分子调控机制

来源 :安徽大学 | 被引量 : 0次 | 上传用户:num184015922
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量测序技术的发展,产生海量生物数据,但是如何从生物大数据中挖掘出所蕴含生物规律是一个巨大的挑战。生物信息学是一门利用统计分析、计算方法以及其他学科来分析研究生物学的交叉学科。基因表达是一个高度调控的过程,一直是生物信息学的研究热点之一。基因表达过程可以分为转录和翻译两大部分,在每一阶段都有众多的调控元件、蛋白质分子参与其中,任何一个阶段出现异常,都有可能导致基因功能失活,影响基因的表达,最后导致疾病的发生。调控元件在基因组上广泛分布,深入参与基因的表达,调控元件的功能活性变化情况对基因表达有重要作用。落在调控元件上的基因突变可以改变元件的功能活性,对基因表达产生异常影响,是重要的分子致病机制之一。为了定量度量不同调控元件突变对基因表达的影响程度,本文对四类不同疾病的相关突变的分子调控机制进行了研究,发现不同种类的疾病突变具有不同特异性的分子调控机制。另外,利用序列模式挖掘建模方法,对调控元件中的启动子序列和增强子序列进行建模研究,进一步分析启动子和增强子突变致病机制。本文主要研究工作和创新之处如下:(1)不同种类的疾病突变富集于不同的调控元件区域。首先从FANTOM、ENCODE项目组公布的数据中获取九类调控元件,发现不同类型调控元件在基因组上的分布显著差异;然后从OMMI,GWAS,ClinVar,VarDi等数据库获取四类疾病突变数据:遗传疾病突变,癌症诱发性生殖细胞突变,癌症体细胞突变和复杂疾病突变;统计四类疾病突变在九类调控元件上的发布,发现遗传疾病突变富集于启动子,癌症突变富集于启动子、甲基化区域和染色体物理互作区域,复杂疾病在九类调控元件上的分布均匀。(2)利用序列模式挖掘模型,对启动子和增强子的突变致病机制进行研究,量化突变对启动子和增强子功能活性的影响程度。基因序列数据上蕴含着丰富的调控序列,它们能够在基因表达过程中发挥调控功能,产生不同的蛋白产物。结合序列的差异性以及保守性特征,本文融合频繁模式挖掘与PSSM模型,对启动子和增强子进行建模研究,实现了对启动子信号强度和增强子信号强度的定量度量,计算验证实验表明该模型能够有效的区分真、假启动子以及增强子。并进一步对启动子和增强子上的突变进行研究,结果显示启动子信号强度降低则致病概率增大,表明降低启动子信号强度的启动子单核苷酸突变与疾病有正相关性;而增强子上疾病突变导致的信号强度的改变,与疾病发生无显著相关性。
其他文献
按照《国务院办公厅关于压缩不动产登记办理时间的通知》(国办发[2019]8号)和《自然资源部办公厅关于印发的函》(自然资办函[2019] 807号)精神,成都市作为全国不动产登记电子
期刊
近些年来,作为涉及计算机图形学、多媒体和人机接口等技术的新兴技术,针对虚拟现实的研究与应用发展十分迅速。它已经广泛应用于教育、娱乐、建筑设计等多个领域。伴随着生活水
信息检索是随着科学技术的发展和信息量的激增而产生的技术,并在人们的工作和生活当中发挥着越来越重要的作用。人们在平时经常用到的信息大部分都是用文本形式来表示的,所以
大数据技术在信息社会进一步发展的现在,对新闻传播内容生产的影响日益扩大.本文采用拉斯韦尔提出的传播学5w范式来分析和研究新闻传播的各个要素和新媒体时代新闻传播领域发
确立平等保护物权的基本原则rn《民法典》物权编第207条规定:国家、集体、私人的物权和其他权利人的物权受法律平等保护,任何组织或者个人不得侵犯.这一规定同《物权法》第4
期刊
6月16日一大早,太阳刚刚升起,四川省甘孜藏族自治州丹巴县半扇门镇的会议室就已人头攒动,热闹非凡.40余名头戴花帕、身着长裙的藏族妇女正在这里接受刺绣方面的指导,这是四川
期刊
随着我国的经济发展和资本市场的完善,相关数据获得和操作简单容易,使得市场法和收益法在机器设备的运用中较为广泛,而成本法的参数由于需要根据不同类型的机器设备进行单独
日前,自然资源部办公厅函印发《“互联网+不动产登记”建设指南》(以下简称《指南》),要求各地结合本地实际,规范推进“互联网+不动产登记”,持续推升不动产登记便民服务水平
期刊
近几年来,我国教育事业在不断的改革和发展,各个方面都取得了很大的成功,教育质量也在逐步上升.教育领域的发展离不开每一所学校的有效管理,对于学校来说,档案管理工作非常重
从马克思主义中国化的内涵、特点;形成机制是认识和实践的双向互动两方面探索中国化的规律性.