基因水平的疾病遗传关联分析方法研究

被引量 : 0次 | 上传用户:qiuxuefalv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:基于单核苷酸多态性(Single nucleotide polymorphism,SNP)的全基因组关联研究(Genome wide association study,GWAS)能够有效地挖掘多基因复杂性状疾病的易感基因,在国内外的疾病遗传关联研究中已得到了广泛应用。但由于单纯SNP的关联分析存在一些缺点和限制,近年来更多研究开始发展基因水平的疾病遗传关联分析方法。本研究目的是发展一种新的基于连锁不平衡(Linkagedisequilibrium,LD)结构的基因水平关联分析方法,利用Monte Carlo数据模拟方法对其及其它几种常用的基因水平的关联分析方法进行评价,了解各种方法的优缺点和适用条件,并将新方法应用到真实的冠心病GWAS数据,挖掘冠心病相关的易感网络模块和基因,为复杂性状疾病的发病机制研究提供新线索。方法:1、利用Monte Carlo方法模拟基因水平的遗传关联数据。首先假定基因型数据为连续型变量数据且服从多元正态分布,根据预先设定好的相关矩阵即LD系数矩阵(初始LD阵),产生连续型模拟数据;然后根据预设的病例组和对照组的基因型频率将模拟数据分段离散化,产生符合各项预设条件的遗传模拟数据,且基因型模拟数据的相关阵等于初始LD阵。2、利用Monte Carlo模拟数据评价基因水平的关联分析方法。我们发展了一种新的基于LD结构的基因水平关联分析方法(LD-Fisher):首先利用单倍型分析算法对基因的LD结构进行分析,获得基因上相对独立的单倍域,并获得每个单倍域中关联最显著的SNP,然后利用Fisher组合法获得基因水平的整合分析结果。我们根据病例组和对照组的等位基因频率、SNP与疾病之间的关联系数、SNP数量、单倍域数量、易感SNP数量、SNP的LD结构等参数,采用Monte Carlo方法对参数的各种预设值和组合进行模拟,利用这些模拟数据评价多种基因水平的关联分析方法的统计功效。3、应用基因水平的关联分析方法分析冠心病GWAS数据,挖掘冠心病易感网络模块和基因。在对冠心病GWAS数据基因水平的关联分析基础上,构建冠心病相关生物信息网络,并对网络模块和特征进行分析,挖掘冠心病相关的易感网络模块和基因。结果:1、利用SAS程序我们实现了基因水平的遗传关联数据的Monte Carlo模拟,结果显示,模拟遗传数据的等位基因频率和LD结构等参数均非常接近预先设定的参数。2、在几种基因水平的关联分析方法中, Logistic主成分分析法(Principalcomponent analysis-logistic regression,PCA-logistic)和我们发展的LD-Fisher表现最为突出。PCA-logistic在设定较高累积贡献率参数95%(PCA95)后,无论单倍域数目多少,其统计功效都接近1,而降低累积贡献率阈值为85%(PCA85)后模拟结果并不理想;LD-Fisher克服了Fisher组合法所存在的受到SNP的LD结构影响的问题,在1个单倍域的情况下统计功效接近1,比PCA95略低,超过PCA85;而在多个单倍域的情况下,达到PCA95的统计功效。3、通过对冠心病的基因水平关联分析(LD-Fisher)和生物网络分析发现了四个冠心病的易感网络模块,其中最重要的一个模块包含15个相互连通的的子功能模块。我们发现模块中存在两个重要的冠心病易感基因MAPK10(OR=32.5,P3.51011)和COL4A2(OR=2.7,P2.81010),它们得到了其他基因水平的关联分析方法和GWAS数据集的独立验证。结论:1、我们所发展的基因水平的遗传关联数据的Monte Carlo模拟方法能够产生满足预设参数的模拟数据,并用于基因水平的关联分析方法的评价分析,也可以用于其他遗传关联分析方法的评价。2、我们所发展的基因水平关联分析方法LD-Fisher不仅具有和PCA-logistic相近的很高的统计功效,而且因为其具有直观简洁的遗传学解释,可以用于多基因复杂疾病的基因水平的关联分析。3、通过对冠心病真实GWAS数据的应用,我们发现基因水平的关联分析方法和生物网络分析方法能够改善目前单纯应用SNP关联分析所存在的不足,促进多基因复杂疾病的易感性研究和疾病分子机制的阐明。
其他文献
随着嵌入式技术的进步,工业以太网开始快速发展,采用传统现场总线的运动控制系统,在实时性和同步精度等方面已经不能满足当前行业的发展需求,而且统一标准的缺乏导致开放性不足。
会计政策选择是企业会计主体在会计政策中挑选的行为,它具有目的性。作为企业代理人的经理人选择不同的会计政策会产生不同的会计信息,进而会带来各个利益关系集团间不同的利益
本文以安溪铁观音为实验对象,对铁观音传统加工工艺的加工工序中的香气成分、不同加工工艺的铁观音香气成分和铁观音香气的生物活性等进行了研究。论文主要研究工作如下:采用固
近二十年来我国建筑业快速发展,结构更加复杂、工期要求更加严苛的项目比比皆是。但是,越来越复杂的施工过程,导致工程进度信息成几何倍数增长,没有一个很好的平台能够承载这些信
随着数模混合信号电路的发展,其在国防军事装备等领域的应用愈发广泛,由于应用场合对可靠性要求较高,需要对数模混合电路进行实时监测。但混合电路结构多样、信号复杂,尚无法提出
建筑业在我国经济发展中一直占据着举重若轻的地位,随着市场竞争日益剧烈,建设项目的投资力度呈现巨额增长。设计理念不断创新的同时,技术难度也不断增加,施工项目在此种环境下面
针对当前评价方法对彩色图像评价的不足,提出一种基于彩色视觉相似性的图像质量评价方法。首先通过把彩色图像转换到相对均匀的色空间(LAB2000HL),再根据视觉空间响应特性分
目的探讨和分析不同年龄小儿脑瘫经过临床康复护理治疗后的效果。方法对本院康复科收治的小儿脑瘫患者全部应用运动疗法、作业疗法、语言疗法、药物治疗等综合性康复护理手段
生烃动力学在煤成气藏形成研究中具有重要的应用价值,这一领域近几年的研究进展主要有:与热史结合可进行烃源灶的动态评价,描绘地质历史时期烃源灶的演化;根据煤成气碳同位素
为了实现建筑参观的真实感和沉浸感,该文结合虚拟现实技术的综合应用,使用SketchUp建立建筑三维模型和室内景观三维模型,以目前性能较高的开源图形引擎OSG(OpenSceneGraph)作