基因变异关联分析的统计方法研究与应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:shui__hen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类的很多疾病都是复杂疾病,其发生和发展的过程可能都要受到基因、环境等各种因素的影响,所以寻找致病基因位点对人类认识复杂疾病的发病机制、找到正确的诊断和治疗以及预防方法都有重要的意义。全基因组关联分析已经成功地辨别出很多与人类性状或复杂疾病相关的常见基因变异。随着研究的深入进行人们发现了许多复杂疾病与罕见变异相关。因此,基因变异的关联分析成为了近几年的研究热点问题。本论文主要利用统计方法研究疾病与基因变异之间的关联性。首先,利用结合P值的统计方法分析了基因变异和二分性状之间的关联性。将基因区域内的每个罕见变异进行Fisher精确检验,每个常见变异进行计分检验,得到每个检验的P值。再根据病例组和对照组含有的次等位基因个数将所有变异分为有害变异和保护变异。按照这两种变异各自进行P值的加权组合,每个变异分别给予合适的权重。罕见变异的权重取为参数为1和25的贝塔分布密度函数,常见变异的权重取为参数为0.5和0.5的贝塔分布密度函数。为了防止非致病变异的影响,将P值比某个临界值大的基因变异去掉。临界值不固定为一个值,而是使用多个临界值,再根据给定的数据集选择最优临界值。其次,利用结合P值的统计方法分析了罕见变异和数量性状之间的关联性。对基因区域上的每一个罕见变异进行计分检验,同时调整协变量,得到检验的P值。再根据携带和不携带次等位基因的个体的性状值的平均值将基因变异划分为有害变异和保护变异,按照两种变异分别进行P值的截尾加权组合,每一个变异的权重取为参数为1和25的贝塔分布密度函数。当致病变异的影响方向不同或者有大量非致病变异存在时,前面提出的两种方法是稳健的。最后,在极端表型样本设计下分析了罕见变异和数量性状之间的关联性。首先考虑样本的设计,选取表型值为极端值的样本会增加罕见变异关联的信号。将极端表型做二分处理,表型值比较大的个体作为病例组,表型值比较小的个体作为对照组。对于这样的“病例-对照”数据建立logistic回归模型,将所有基因变异的效应分为共同效应和偏离共同效应的个体效应。共同效应看作固定效应,个体效应看作随机效应。对两种效应进行检验,计算各自的P值。再用Fisher结合P值的方式和最小P值的方式两种办法得到最终的检验统计量。大量的模拟分析表明,我们提出的方法在大多数情况下有比较高的功效,在样本量相同的情况下,使用极端表型样本要比使用随机样本功效高很多。
其他文献
别抱怨测量方法;给“差异”定价;“民有、民治、民享”广告让消费者创造广告既节约成本又可获得效果
<正>目的:针对髌腱末端病患者,从疼痛缓解、功能恢复及炎症愈合方面观察分析聚焦超声波的治疗效果并进行综合评价。方法:(1)筛选16名男性髌腱末端病患者。筛选条件:①患者主
会议
<正> 小油菜(B.campestris L.)喜凉耐寒,是光温适应范围广、发育速度快的特早熟品种,既可以作为冷凉地区的主栽作物,也可以在热量条件较好的地区用作复种、填闲。近年来,小油
针对GNSS-RTK技术在FAST馈源舱测量中的可行性问题,提出GNSS-RTK测量方案,分析GNSS天线随馈源舱运动产生倾斜时对卫星可见性的影响,以及射电望远镜反射面板时GNSS天线的多路
【正】 广西省分行于八月十五月至二十三日召开了全省第九届支行行長会議,集中研究下半年旺季銀行工作。为了保証完成旺季工作任务,分行号召全省各行职工进一步全面开展社会
在体制改革继续深化、新型城镇化不断深入、城市营销如火如荼的大背景下,研究福州市的城市营销策略,探究福州市如何吸引国内外资源,如何整合城市的历史、文化、自然景观,如何
青海湖鸟岛的蛋岛连陆以后,鸟类赖以生息繁衍的生态环境发生了很大了变化。首先是来自陆地的天敌造成了蛋岛的危害。其次由于气候条件对蛋岛的微环境形成不利影响,使鸟类赖以营
为研究煤自燃阻化过程中宏观特性与自由基微观结构的关系,利用煤自燃程序升温实验装置对阻化煤样进行程序升温氧化实验,研究阻化煤样在不同阻化剂及不同条件时的宏观表征参数
本文对主要来自青藏高原的20个青稞亲本品种进行了主成份分析和聚类分析。分析结果前4个主成份即λ_1(穗数因子)、λ_2(生产力因子)、λ_3(粒重因子)、λ_4(熟性因子)对变异
为识别大伙房水库控制流域水体水质现状及主要污染因子,通过统计分析2014—2018年大伙房水库控制流域水体的水质数据,采用综合加权指数法和主成分分析方法,开展了大伙房水库