K层四格表OR值的一致性检验方法模拟比较研究

被引量 : 1次 | 上传用户:papyevin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景:流行病学研究中,为了排除混杂因素对疾病与暴露之间关联性的影响,常常需要将资料进行分层分析。当分组变量和结局变量均为二分类,混杂变量为K个水平时,观察到的数据可以K×2×2表的形式展现。但是,在评估疾病与暴露因素之间是否有关联以及在估计公共比数比(odds ratio, OR)之前,需要对各层之间的比数比进行一致性检验。关于K×2×2表资料的一致性检验,众多学者提出了不同方法,根据现已公开发表的文献可以概括为11种。本研究按求解公共OR值的计算方法类型以及数据结构特点,将这11种一致性检验方法划分为如下6大类:①Mantel-Haenszel方法(简称M-H):基于Mantel和Haenszel (1959)求解公共OR值的方法,主要有Breslow-Day法和Breslow-Day-Tarone法两种,后者是对前者方法的校正。②Zelen精确概率方法(简称exact):不用先求解公共OR值,这种一致性检验方法是在Fisher精确概率方法基础上的一种拓展方法。③近似非条件最大似然(AU, Asymptotic Unconditional)方法:基于近似非条件最大似然估计方法求解公共OR值,有Wald法、Score法及似然比检验法三种方法。④加权最小二乘(WLS, Weighted Least Square)方法:基于加权最小二乘方法求解公共OR值的一致性检验方法。⑤近似条件最大似然(AC, Asymptotic Conditional)方法:基于超几何分布用近似条件最大似然估计方法求解公共OR值,有Zelen近似法和Score法两种方法。⑥稀疏数据(SD, sparse data)检验方法:基于近似条件最大似然估计方法求解公共OR值,并且结合中心极限定理或混合线性模型理论,主要有Liang和Self(1985)提出的T4和T5两种方法。在划分为上述6类的基础上,作者期望以此为切入点能够从不同于前人的角度对K×2×2表资料一致性检验方法进行更加独特的模拟比较,以做出更为合理细致的解释。研究目的:本研究旨在通过Monte Carlo方法,模拟比较不同一致性检验方法的检验效能1—p和Ⅰ型错误α,以期望回答如下几个问题:1.针对不同的数据类型,哪种检验方法更适合于稀疏数据,哪种方法对于非稀疏数据更值得采用?2. Zelen精确概率法优劣性如何,是否比其他近似方法更为“精确”?3.基于超几何分布而求解得到公共OR值的检验方法是否比其他方法更值得提倡?4.广泛应用于Meta分析异质性检验的WLS方法,在默认的检验水准0.05时,其检验效能以及Ⅰ型错误与其他检验方法比较如何?5. Meta分析异质性检验时,我们常常将检验水准设置为0.10,因此当将检验水准设定为0.10时,这11种检验方法的检验效能及Ⅰ型错误如何,模拟比较结果与检验水准为0.05时比较是否发生较大改变?方法:模拟过程考虑4个参数,即第i层样本量Ni、ORi值、对照组暴露概率πoi,和层数K,每个参数分别取不同值以此构成多种参数组合,每种组合模拟运算1000次。借助SAS9.2(?)ranbin随机数函数在给定种子数、样本量Ni、对照组暴露概率πOi,情况下产生第i层对照组暴露数;病例组暴露概率由πli=(?)计算而得,同理可以产生第i层病例组暴露数。当进行Ⅰ型错误α比较时,各层间ORi值恒相等,先用随机数函数rannor产生均数为log OR,方差为0的随机数,然后再将log ORi指数化;当进行检验效能1-β比较时,K层ORi值来自不同的总体,先用随机数函数rannor产生均数为log OR,方差为1的随机数,然后再将log ORi指数化。不管是比较Ⅰ型错误α还是检验效能1-β时,对照组暴露概率πO`i由两种方式产生,一种是为固定相等的常数,还有一种是由均匀分布产生。另外,鉴于一致性检验方法常用于Meta分析中,我们在进行Meta分析的效应量异质性检验时,检验水准常取0.10,因此本研究在进行模拟比较时,设定两个检验水准,分别为0.05和0.10。结果:在控制Ⅰ型错误方面:(1)针对不同的数据类型:近似非条件Wald法更适合于稀疏数据;非稀疏数据类型,Breslow-Day法、Breslow-Day-Tarone法、近似非条件Score法以及近似非条件似然比检验法较为合适。(2)Zelen精确概率法过于保守,并且随着样本量的增加以及层数逐渐增大时,精确概率法的运算量以及所需的运算时间也随之迅速增加。(3)基于超几何分布求解得到公共OR值的检验方法,在控制Ⅰ型错误方面相对差于其他检验方法。(4)广泛应用于Meta分析的WLS法,不管检验水准取值为0.05还是0.10时,与M-H以及AU方法相比均过于保守。(5)大多数情况下,检验水准设定为0.05和0.10时,这11种方法间的比较并不因为检验水准的不同而发生较大的改变。但是在某些特定情形下,检验水准设定为0.10甚至稍显更为合适。从检验效能方面来看:(1)这11种方法均不适用于稀疏数据情形,当样本量较大层数也较大时,M-H方法、AU方法以及AC方法均较为合适。(2)Zelen精确概率法不值得提倡,其原因在于不仅检验效能低,而且需要的运算量、运算时间也较大。(3)基于超几何分布求解得到公共OR值的检验方法,AC方法检验效能尚可,但是SD方法检验效能较差。(4)广泛应用于Meta分析的WLS法,当样本量以及层数较大时值得采用。(5)当检验水准设定为0.10时,这11种检验方法的检验效能间的比较,较0.05时并未发生较大的改变。结论:(1)当样本量较小时,尚且没有合适的检验方法值得采用。(2)SD方法不提倡使用。(3)Zelen精确概率法过于保守,不推荐使用。(4)近似非条件Score法以及近似非条件似然比检验法最为合适,其次为M-H方法。(5)M-H方法由于计算的便捷性,在样本量进一步增大,层数进一步增加时,可以视为最佳的选择。Breslow-Day-Tarone法比Breslow-Day法更为保守,所以相对来说,本文不建议对Breslow-Day法进行校正。(6)AU方法与AC方法相比,综合Ⅰ型错误以及检验效能来说,AU方法优于AC方法。(7)WLS方法相对于M-H以及AU方法来说偏于保守,但是当样本量很大时,由于其计算的便捷性,因此,被广泛使用于Meta分析中。(8)当检验水准设定为0.10时,各个方法之间的模拟比较结果与检验水准为0.05时一致。由于在样本量较小时各个方法检验效能非常低下;另外,本研究还发现在某些情形时,检验水准设为0.10更为值得提倡。所以,作者建议一致性检验时,检验水准取0.10更为合适。
其他文献
低碳农业,实现农业可持续发展的有效形式,是目前及今后农业发展的主要方向。低碳农业,耗能低污染小,农产品优质安全,且协调平衡生态系统,真正实现农业良性循环生产,可持续发
加强纳税筹划是加强企业财务管理的重要内容,企业所得税是企业的一大税种,其纳税筹划的意义更为重大。当前纳税筹划存在着误区,本文从所得税纳税时间入手,通过相关案例探讨了
名 称炯炸上同焊炸下限coqM甲 烷乙 烷丙 烷丁 烷戊 烷甲 苯 o乙 烯丙 烯丁 烯异 丁 烯天 汰 气 1.58 1.40 5.00 3.12 2.90 二.g0 二.毛o 1.28 1.50 3.00 2.00 二.7o 1.60,5.
企业资源计划系统(ERP)应用技术的成熟和典型案例为企业实现会计信息化指明了方向,为会计信息化的实现提供了技术平台,为改变传统成本会计核算方法创造了条件,使成本管理活动
乾立基金作为国内领先的基金资产管理机构,深度探索房地产投资领域的互联网化和轻资产运营,其执行总裁傅冬亮认为这是行业现在或者未来的趋势,乾立一直在学习和关注。2015年,
从低碳视角下引入农业碳汇作为期望产出指标,运用以农业碳排放量为非期望产出的超效率SBM模型,测算2007—2016年长江经济带农业生态效率并分析其时空分布,然后通过Tobit回归
产学研协同创新是企业、高等学校/科研机构、政府等三个基本主体,利用三方各自的优势资源和能力,在政府、科技服务中介以及金融机构等相关主体的协同支持下,共同进行技术开发
本文以己二酸、1,4-丁二醇和尿素为原料,在氩气环境下,通过高温熔融缩聚反应合成了一种新型可降解的己二酸-1,4-丁二醇-尿素共聚物,并对反应时间、催化剂种类及其用量、原料配比
农民形象在当代文学中明显占据着重要的位置。就文学史的发展过程而言 ,农民形象的演变 ,甚至可以视作是各个文学段落的形象标志。农民形象的变化不仅体现着社会的现代化程度
结合液晶显示器面板制造洁净厂房的特点,对超大面积、高空间、FFU数量巨大的电子工业洁净室工程性能参数的检测方法进行介绍和分析,以实际的检测数据对某些测试方法进行实验