论文部分内容阅读
研究背景:流行病学研究中,为了排除混杂因素对疾病与暴露之间关联性的影响,常常需要将资料进行分层分析。当分组变量和结局变量均为二分类,混杂变量为K个水平时,观察到的数据可以K×2×2表的形式展现。但是,在评估疾病与暴露因素之间是否有关联以及在估计公共比数比(odds ratio, OR)之前,需要对各层之间的比数比进行一致性检验。关于K×2×2表资料的一致性检验,众多学者提出了不同方法,根据现已公开发表的文献可以概括为11种。本研究按求解公共OR值的计算方法类型以及数据结构特点,将这11种一致性检验方法划分为如下6大类:①Mantel-Haenszel方法(简称M-H):基于Mantel和Haenszel (1959)求解公共OR值的方法,主要有Breslow-Day法和Breslow-Day-Tarone法两种,后者是对前者方法的校正。②Zelen精确概率方法(简称exact):不用先求解公共OR值,这种一致性检验方法是在Fisher精确概率方法基础上的一种拓展方法。③近似非条件最大似然(AU, Asymptotic Unconditional)方法:基于近似非条件最大似然估计方法求解公共OR值,有Wald法、Score法及似然比检验法三种方法。④加权最小二乘(WLS, Weighted Least Square)方法:基于加权最小二乘方法求解公共OR值的一致性检验方法。⑤近似条件最大似然(AC, Asymptotic Conditional)方法:基于超几何分布用近似条件最大似然估计方法求解公共OR值,有Zelen近似法和Score法两种方法。⑥稀疏数据(SD, sparse data)检验方法:基于近似条件最大似然估计方法求解公共OR值,并且结合中心极限定理或混合线性模型理论,主要有Liang和Self(1985)提出的T4和T5两种方法。在划分为上述6类的基础上,作者期望以此为切入点能够从不同于前人的角度对K×2×2表资料一致性检验方法进行更加独特的模拟比较,以做出更为合理细致的解释。研究目的:本研究旨在通过Monte Carlo方法,模拟比较不同一致性检验方法的检验效能1—p和Ⅰ型错误α,以期望回答如下几个问题:1.针对不同的数据类型,哪种检验方法更适合于稀疏数据,哪种方法对于非稀疏数据更值得采用?2. Zelen精确概率法优劣性如何,是否比其他近似方法更为“精确”?3.基于超几何分布而求解得到公共OR值的检验方法是否比其他方法更值得提倡?4.广泛应用于Meta分析异质性检验的WLS方法,在默认的检验水准0.05时,其检验效能以及Ⅰ型错误与其他检验方法比较如何?5. Meta分析异质性检验时,我们常常将检验水准设置为0.10,因此当将检验水准设定为0.10时,这11种检验方法的检验效能及Ⅰ型错误如何,模拟比较结果与检验水准为0.05时比较是否发生较大改变?方法:模拟过程考虑4个参数,即第i层样本量Ni、ORi值、对照组暴露概率πoi,和层数K,每个参数分别取不同值以此构成多种参数组合,每种组合模拟运算1000次。借助SAS9.2(?)ranbin随机数函数在给定种子数、样本量Ni、对照组暴露概率πOi,情况下产生第i层对照组暴露数;病例组暴露概率由πli=(?)计算而得,同理可以产生第i层病例组暴露数。当进行Ⅰ型错误α比较时,各层间ORi值恒相等,先用随机数函数rannor产生均数为log OR,方差为0的随机数,然后再将log ORi指数化;当进行检验效能1-β比较时,K层ORi值来自不同的总体,先用随机数函数rannor产生均数为log OR,方差为1的随机数,然后再将log ORi指数化。不管是比较Ⅰ型错误α还是检验效能1-β时,对照组暴露概率πO`i由两种方式产生,一种是为固定相等的常数,还有一种是由均匀分布产生。另外,鉴于一致性检验方法常用于Meta分析中,我们在进行Meta分析的效应量异质性检验时,检验水准常取0.10,因此本研究在进行模拟比较时,设定两个检验水准,分别为0.05和0.10。结果:在控制Ⅰ型错误方面:(1)针对不同的数据类型:近似非条件Wald法更适合于稀疏数据;非稀疏数据类型,Breslow-Day法、Breslow-Day-Tarone法、近似非条件Score法以及近似非条件似然比检验法较为合适。(2)Zelen精确概率法过于保守,并且随着样本量的增加以及层数逐渐增大时,精确概率法的运算量以及所需的运算时间也随之迅速增加。(3)基于超几何分布求解得到公共OR值的检验方法,在控制Ⅰ型错误方面相对差于其他检验方法。(4)广泛应用于Meta分析的WLS法,不管检验水准取值为0.05还是0.10时,与M-H以及AU方法相比均过于保守。(5)大多数情况下,检验水准设定为0.05和0.10时,这11种方法间的比较并不因为检验水准的不同而发生较大的改变。但是在某些特定情形下,检验水准设定为0.10甚至稍显更为合适。从检验效能方面来看:(1)这11种方法均不适用于稀疏数据情形,当样本量较大层数也较大时,M-H方法、AU方法以及AC方法均较为合适。(2)Zelen精确概率法不值得提倡,其原因在于不仅检验效能低,而且需要的运算量、运算时间也较大。(3)基于超几何分布求解得到公共OR值的检验方法,AC方法检验效能尚可,但是SD方法检验效能较差。(4)广泛应用于Meta分析的WLS法,当样本量以及层数较大时值得采用。(5)当检验水准设定为0.10时,这11种检验方法的检验效能间的比较,较0.05时并未发生较大的改变。结论:(1)当样本量较小时,尚且没有合适的检验方法值得采用。(2)SD方法不提倡使用。(3)Zelen精确概率法过于保守,不推荐使用。(4)近似非条件Score法以及近似非条件似然比检验法最为合适,其次为M-H方法。(5)M-H方法由于计算的便捷性,在样本量进一步增大,层数进一步增加时,可以视为最佳的选择。Breslow-Day-Tarone法比Breslow-Day法更为保守,所以相对来说,本文不建议对Breslow-Day法进行校正。(6)AU方法与AC方法相比,综合Ⅰ型错误以及检验效能来说,AU方法优于AC方法。(7)WLS方法相对于M-H以及AU方法来说偏于保守,但是当样本量很大时,由于其计算的便捷性,因此,被广泛使用于Meta分析中。(8)当检验水准设定为0.10时,各个方法之间的模拟比较结果与检验水准为0.05时一致。由于在样本量较小时各个方法检验效能非常低下;另外,本研究还发现在某些情形时,检验水准设为0.10更为值得提倡。所以,作者建议一致性检验时,检验水准取0.10更为合适。