X染色体标记位点上Hardy-Weinberg平衡律的似然比检验及印记效应的检验

来源 :南方医科大学 | 被引量 : 1次 | 上传用户:eyoujin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景:关联分析是一种通过标记位点来定位疾病位点的有用工具,在病例对照数据与家系数据中都有广泛的应用。它利用标记位点与疾病位点间的关系来定位变异基因。如果标记位点离疾病位点很近,这样会导致连锁不平衡,那么两位点同时被传递的可能性很大。于是,患病人群中该标记等位基因频率要高于或低于正常人群。所以,关联分析通过标记位点定位了疾病位点。常染色体上基于病例对照研究的关联分析通常需要Hardy-Weinberg平衡律(Hardy-Weinberg equilibrium)的假设。如果Hardy-Weinberg平衡律不成立时,基于病例对照数据的关联分析方法的第一类错误率可能会偏大。而今,X染色体上标记位点与疾病位点间关联性的检验方法研究以及Hardy-Weinberg平衡律对关联分析的影响研究越来越受到重视。然而,在X染色体上,有两个问题需要被关注:(1)对于同一个位点上的同一等位基因,男性与女性的等位基因频率是否相等;(2)女性群体中的近交系数是否为0。因此,男、女性间的等位基因频率是否有显著差异和女性中的Hardy-Weinberg平衡律是否成立经常用来筛选X染色体上连锁的变异基因。对于(1)和(2),已经有学者提出了相应的方法分别对其进行检验。然而,这些方法的第一类错误率和检验效能还没有被探讨与研究。另外,目前尚未见文献报导同时检验(1)与(2)的方法。印记效应(imprinting effects),也称亲源效应(parent-of-origin effects),是一种有关亲代基因的表达与否的后生现象,对研究基因对表型的影响有着非常重要作用。基因印记是一种非孟德尔遗传现象。如果后代来自父亲的等位基因没有被表达,而来自母亲的等位基因被表达,此现象称为父系印记;反过来,如果只有来自父亲的基因被表达而来自母亲的基因没有被表达,即为母系印记。存在印记效应时,两种有序杂合子基因型的外显率可能是不同的。常染色体上常见的与印记相关的疾病有:Angelman综合征、Beckwith-Wiedemann综合征、Prader-Willi综合征、肥胖症、糖尿病等。而X染色体上与印记效应相关的疾病有Turner综合征。Turner综合征只在女性个体中存在,可能是由其中一整条X染色体的缺失或者部分缺失引起。所以,印记效应的检验在研究遗传疾病方面有重要意义。常染色体上已经有很多检验印记效应的方法,但这些方法都不适用于X染色体。到目前为止,我们尚未发现X染色体上印记效应的检验方法。需要注意的是,X染色体在男、女性间的遗传是不对称的。女性有两条X染色体,一条是父系的,一条是母系的;而男性只有一条母系的X染色体。这种不对称性使得研究X染色体上印记效应检验的方法更加困难。另一方面,目前已经有很多基于家系或病例对照数据的X染色体上关联分析方法。但是,在关联存在的情况下,尚未有方法用于检验X染色体上的印记效应。本文的研究目的主要有以下两点:(1)基于X染色体上的标记位点,提出检验Hardy-Weinberg平衡律的似然比方法;(2)针对不同的核心家庭结构,提出检验印记效应的非参数方法。方法:(1)首先,基于X染色体上收集的样本,通过合并Zheng等人提出的两个检验统计量(检验男、女性间的等位基因频率是否相等(Z1)以及女性群体中的近交系数是否为0(Z2)),提出Z0统计量来同时检验(1)男性等位基因频率等于女性等位基因频率和(2)女性群体中的近交系数为0。为了提高此方法的检验效能,我们进一步提出一种新的似然比检验方法。对于X染色体上的某一个位点,首先分别写出原假设和备择假设下的似然函数。然后,用EM算法得到未知参数的最大似然估计值并且构建LRTo统计量来同时检验(1)和(2)。如果原假设被拒绝,则进一步构造两个假设检验来找到原假设被拒绝的原因。于是,提出另外两个似然比检验统计量,LRT1(检验男女性的等位基因频率是否相等)和LRT2(检验女性中近交系数是否为0)。值得注意的是,从模拟结果可以看出,LRTo和LRT2的第一类错误率偏保守。因此,我们用参数的bootstrap方法来评价LRTo和LRT2的有效性及其表现,分别记为LR-Tob和LRT2b。而且,我们还探讨了群体分层对新提出方法的影响。另外,我们用均方根误和偏差来评估未知参数的最大似然估计值的估计准确性。最后,我们使用了来自北美的类风湿关节炎基因数据对新提出方法加以实例验证。(2)考虑在关联存在的前提下,提出x染色体上质量性状的印记效应检验方法。首先,针对父母和患病女儿组成的三联体家庭,用统计量XPAT (parental-asymmetry test on X chromosome)来检验X染色体上的印记效应。然后,基于两人家庭(父亲-女儿对或母亲-女儿对),提出检验统计量1-XPAT。通过同时考虑三联体和两人家庭,构造统计量C-XPAT来检验印记效应。更进一步地,我们把这三种方法拓展到可以纳入多个小孩且其中至少有一个患病女儿的完整家庭(家庭成员的基因信息是完整的)和不完整核心家庭(父代中父亲或母亲的基因信息缺失)。值得注意的是,因为1-XPAT统计量中需要用到等位基因频率,我们用三种方式加以处理:用真实的等位基因频率,相应的统计量记为1-XPATt;用母亲等位基因频率的估计值,相应的统计量记为1-XPATm;用父亲等位基因频率的估计值,相应的统计量记为1-XPATfo最后,我们使用了来自北美的类风湿关节炎基因数据对新提出方法加以实例验证。结果:(1)模拟结果表明,LRT0和LRT2的第一类错误率均偏保守,LRT1的第一类错误率接近显著性水平。而LRT0和LRT2经过参数的bootstrap方法校正后(LRTob和LRT2b)能很好地控制犯第一类错误的概率。Z0,Z1和Z2也能很好地控制第一类错误率。通过不同的参数设置来比较这几个统计量的检验效能,LRTob的检验效能比LRTo与Z0的都要高,而LRTo和Zo的检验效能很接近;LRT1和Z1的检验效能也很接近;当近交系数大于0时,LRT2b的检验效能比LRT2与Z2的都要高,且LRT2比Z2的检验效能稍微小一点。对于男性等位基因频率的估计值,不管用EM算法估计或Zheng等人的方法估计,值是一样的;对于女性等位基因频率和合并等位基因频率的估计值,不管是用EM算法估计或Zheng等人的方法估计,其均方根误和偏差都很接近。而对于近交系数的估计值,在某些情况下,虽然基于EM算法的偏差比Zheng等人的稍大,但是在所有情况下,基于EM算法的均方根误都比Zheng等人的要小。另外,群体分层模型确实会导致近交系数不为0,这跟Overall和Nichols的结论是一致的。此时基于EM算法的近交系数估计值的均数比Zheng等人的估计值稍大,但相应的标准差要小。另外,类风湿关节炎数据的分析结果表明,虽然没有找到有统计学意义的位点,但证实了新提出方法的实用性。(2)在不同的参数设置情况下,对新提出方法的第一类错误率和检验效能进行了模拟。模拟结果表明,XPAT在各种参数设置下的第一类错误率都在显著性水平附近;1-XPATt和1-XPATm的第一类错误率保持在显著性水平附近,但1-XPATf严重偏大。因此,在后续的模拟研究中,我们仅用母亲等位基因频率的估计值计算1-XPAT的值。通过纳入不完整核心家庭,C-XPAT的检验效能比只纳入完整核心家庭的XPAT明显要高很多。另外,不管女性群体中的近交系数是否为0,新提出方法的第一类错误率一直保持在显著性水平附近。类风湿关节炎数据的分析结果表明,虽然没有找到与印记相关的有统计学意义的位点,但证实了新提出方法的实用性。结论:(1)为了提高检验X染色体上Hardy-Weinberg平衡律的检验效能,提出了三种似然比检验方法。但由于其中有两个统计量的第一类错误率偏保守,所以我们采用参数的bootstrap方法寻找其分布的临界值。模拟结果表明,基于bootstrap方法的LRTob和LRT2b,LRT1,Zo和之前的Z1和Z2的第一类错误率在各自的原假设下都能控制在显著性水平的附近。通过检验效能的比较,LRTob的检验效能比LRT0和Z0都高。在近交系数大于0的情况下,LRT2b的检验效能比LRT2和Z2高很多,然而LRT2比Z2的检验效能稍微小一点。另外,在男性等位基因频率不等于女性等位基因频率的情况下,LRT1和Z1的检验效能很接近。(2)在X染色体上的标记位点与疾病位点存在关联的情况下,针对质量性状,提出检验印记效应的方法。首先,基于由父母和他们患病的女儿组成的三联体家庭,构建X染色体上的亲代不对称检验XPAT。然后,我们用1-XPAT来处理两人家庭(父女对或母女对)。通过同时考虑三联体家庭和两人家庭,我们用C-XPAT来检验印记效应。更进一步地,我们把这三种方法拓展到可以处理完整和不完整核心家庭,这两种核心家庭中可以包含多个女儿,但至少有一个女儿是患病的。在不同的参数设置下,我们通过模拟研究来评估新提出方法的第一类错误率和检验效能。模拟中的样本主要考虑三种不同家庭结构,这样比只考虑一种结构更加合理。模拟结果表明,在不同的参数设置下,新提出方法的第一类错误率被控制得很好。通过检验效能的比较,不论用真实等位基因频率或母亲的基因型估计的等位基因频率,C-XPAT的检验效能都比XPAT高。在此研究中,不需要女性群体中Hardy-Weinberg平衡律成立的假设,这一点已经在理论推断和模拟研究中被证实。
其他文献
目的:探讨5,10-亚甲基四氢叶酸还原酶(MTHFR)基因多态性与食管癌易感性、MTHFR基因多态性与环境因素交互作用与食管癌的关系;探讨微量元素与食管癌的关系;探讨Th1及Th2类细胞因
近年来,由于全国科研人员对基础研究的热情不断增加,各省市基金项目申请书的增长率总体呈现出快于经费的增长态势。加之我国基础研究起步较晚,科研积累少,基金经费虽有一定的增长
本论文对磺胺类兽药残留的化学发光免疫检测方法进行了深入系统的研究。通过免疫兔子获得抗磺胺类药物多克隆抗体。全面优化了检测方法中的各个参数,包括抗体包被量、酶标抗
前言脑卒中是严重危害我国中老年人生命与健康的主要疾病,其致死率、致残率极高,带来了沉重的社会与经济负担。所以,控制脑卒中的发生发展已成为许多学科领域研究的重点。动