论文部分内容阅读
复杂疾病或常见疾病是由常见变异与罕见变异共同影响的。近年来,在常见疾病由常见变异所影响(CDCV)的假设下,全基因组关联研究已检测出数百个与疾病有关联作用的常见变异。然而,常见变异只能解释疾病的很小一部分的遗传信息,并不能完全的解释疾病。随着第二代测序技术的发展,全基因组关联研究将焦点从常见变异转移到最小等位基因频率小于1%的罕见变异上。在常见疾病由罕见变异所影响(CDRV)的假设下,由于罕见变异出现的频率低,提出一个高效检测罕见变异的方法是全基因组关联研究的重点。 在Score-Joint方法和collapsing方法的基础上,本文依据罕见变异的危害效应和保护效应把罕见变异分为两组,从而发展了一个能高效检测罕见变异的方法。此外,本文探究了罕见变异之间的相关性和高估或低估疾病发病率对检测功效的影响,并考虑了大量的模拟研究。在模拟研究中,采用两种方法产生数据——由logistic模型产生数据和由SimRare软件产生数据。设定不同的比值比,获得不同的数据集。利用R软件实现各种模拟研究。 从模拟结果可以看出,在给定的显著性水平(0.05和0.01)下,本文提出的方法的第一类错误率是合理的。我们还将本文提出的方法与SKAT、Score-Joint方法进行比较,当罕见变异对疾病关联作用的方向不同时,本文提出的检验统计量一致的优于SKAT、Score-Joint方法。其次,对于病例组—对照组研究,将疾病发病率简单的假设为0.5是不合理的。