论文部分内容阅读
本文对流行病学研究中的一些热点问题从列联表的角度分析和讨论了它们的统计推断问题。
为了研究某种流行病的流行程度,人们常需要对感兴趣的个体是否感染了这种疾病进行诊断分类.在诊断分类中,价格昂贵的金标准检验和价格相对便宜的筛检方法是常用的两种诊断方法,但是筛俭方法易出现分类误差而使得分类不可靠。为了克服这两种诊断方法的不足,人们常常利用二重抽样检验方法来收集试验信息.在样本量不太大或很小时,本文从小样本的角度,基于一个2×2的列联表和一个二项分布试验,(ⅰ)考虑了二重抽样试验设计下关于疾病流行率的假设检验问题,导出了基于样本方差的Wald统计量、基于限制性极大似然估计下方差的Wald统计量、score检验统计量和似然比检验统计量,通过对各种检验犯第一类错误的慨率和实际的功效的模拟研究,比较了在小样本下基于上述统计量的渐近检验和近似非条件检验的统计性质,提出了在小样本下较为有效的检验方法;(ⅱ)基于以上统计量研究了疾病流行率的置信区间,提出了求疾病流行率的置信区间的渐近方法、近似非条件和bootstrap等方法,通过各种置信区间的经验覆盖概率、经验区间宽度和mesial非覆盖概率与非覆盖概率之比的模拟研究比较了这些置信区间的统计性质;(ⅲ)推导了基于功效的样本量和基于区间宽度的样本量的计算公式,并在样本量的计算没有显式表达式时,提出了一种计算近似样本量的数值算法.通过对各种检验的经验功效和实际水平,置信区间的经验覆盖概率和区间宽度的模拟研究,比较了各样本量公式的准确性.最后,通过一个再生障碍性贫血病的临床数据的分析验证了本章提出方法的有效性.
研究结果表明:(ⅰ)相对于渐近的检验方法,近似非条件的检验方法通常能产生满意的犯第-类错误的概率和更高的功效,另外,Wald(基于限制性极大似然估计的方差,以下简称Wald-2)和score检验统计量比其他的统计量具有更好的统计性质;(ⅱ)基于Wald-2检验和score检验的渐近置信区间、近似非条件置信区间表现最好,它们的经验覆盖概率非常接近于名义水平,而且它们的mcsial非覆盖概率与非覆盖概率之比基本上在区间[0.4,0.6]内;(ⅲ)基于Wald-2检验和score检验得到的样本量公式比其他两个样本量公式更准确。
在分层配对试验研究中,人们常用风险差作为比较两种治疗或两种诊断的有效性的指标.对于不同的层,两种诊断检验的风险差是否有显著的不同?以及在所有层中,究竟是哪些层的风险差有显著差异?为了通过简单的方法和简单的步骤回答这些问题,我们基于多个2×2列联表,考虑了分层配对试验设计下关于风险差的同时置信区间,提出了五种基于Wald区间、Wilson-Score区间和Agreti-Coull区间的同时置信区间以及两种bootstrap同时置信区间。通过对同时置信区间的经验覆盖概率、区间宽度和mcisal非覆盖概率与非覆盖概率之比的模拟研究考察了上述置信区间的统计性质.最后,通过甲状腺瘤研究数据的分析,对本章提出的方法进行了验证.
研究结果表明:(ⅰ)混合(hybrid)同时置信区间好于非混合(non-hybrid)同时置信区间;(ⅱ)基于参数的中位数无偏估计的同时置信区间好于相应的基于参数的极大似然估计的同时置信区间;(ⅲ)基于参数的中位数无偏估计和Wilson-Score区间、Agreti-Coull区间的混合(hybrid)同时置信区间以及基于参数的中位数无偏估计的bootstrap-t分位数同时置信区间,无论是小样本还是大样本下都有满意的统计性质,即这些区间的经验覆盖概率非常接近于名义水平,并且它们的mesial非覆盖概率与非覆盖概率之比基本上在[0.4,0.6]之间.
在眼科或耳科这样的成对器官的流行病学研究中,人们关心的是视网膜的分泌物是否影响视网膜的粘合手术,或两种不同的抗生素治疗是否影响渗液性中耳炎的治疗效果.为此,考虑到如眼科研究数据具有稀疏性、组内相关性以及小样本等特点,我们考虑了双边试验数据下两种手术成功率或药物治疗率的等价性评价问题,基于3×2列联表提出了基于比例差的等价性检验的六种检验统计量:即基于独立性假设的两个Wald型统计量,基于非独立性假设的两个Wald型统计量,似然比统计量和score检验统计量,并基于这些统计量考虑了两种计算近似样本量的方法:一是在给定的显著性水平下,计算使检验达到给定的功效所需要的样本量,二是在给定的置信水平下,计算使置信区间的宽度控制在给定长度内所需要的样本量。在导出的样本量下,通过对各检验的经验功效和实际的犯第一类错误的概率,置信区间的经验覆盖概率和区间宽度的模拟研究,比较了各样本量公式的准确性。最后,通过对渗液性中耳炎的一个临床试验数据的分析,验证了本章提出的方法。
研究结果表明:(ⅰ)忽略数据的相关结构导出的样本量(如基于非独立性假设的Wald型统计量导出的样本量),会使得等价性检验中的功效低于给定的功效水平且犯第一类错误的概率随着相关系数的增大而增大,因而在实际应用中不推荐使用;(ⅱ)考虑了数据的相关结构导出的样本量(如基于非独立性假设的Wald型和score统计量),会使得等价性检验中犯第一类错误的概率和名义水平很接近;(ⅲ)基于非独立性假设的Wald型统计量(Rosner统计量)导出的样本量,无论是基于功效还是区间宽度的方法,都有很好的统计性质,即实际的功效能很满意地控制在期望的功效水平,或置信区间宽度能很准确地控制在期望的宽度内。
在一些临床试验中,研究人员或许想知道视网膜黏合手术的成功率,或渗液性中耳炎的治疗成功率是否与患病个体的年龄有关,或是否与医生的医术水平有关。为此,我们考虑了以不同年龄为分层变量的多中心3×2列联表基于比例差的等价性评价问题:(ⅰ)对于“每一层的比例差都相等”的假设检验问题,导出了检验该假设的score检验统计量、基于Tarone齐性score方法的修正score检验统计量以及基于加权最小二乘估计的WLS检验统计量,并得到了共同的比例差基于score检验统计量的置信区间以及加和(summary)置信区间;(ⅱ)在假设每一层的比例差都相等的条件下,考虑了对所有的层的比例差都等于0的等价性检验问题,导出了检验此假设的分层Wald型检验统计量和score检验统计量以及相应的非分层检验统计量,并分别讨论了大样本理论下的渐近检验和小样本下的近似非条件检验,得到了相应检验的功效函数和样本量的计算公式,并进行了相应的模拟研究.最后,通过一个以年龄作为分层变量的渗液性中耳炎治疗数据的统计分析,验证了本章提出的方法。
研究结果表明:(ⅰ)基于修正score检验统计量和WLS检验统计量的齐性假设检验具有很好的统计性质,其检验的犯第一类错误的概率非常接近于名义水平,且具有较高的功效;(ⅱ)共同的比例差的两种置信区间都有很好的统计性质,其经验覆盖概率与名义水平相当接近,且区间宽度也较短;(ⅲ)对齐性假设下的分层等价性检验,分层的检验比不分层的检验犯第一类错误的概率更接近于名义水平,且具有更高的功效;(ⅳ)基于非独立性假设的分层Wald型检验有很好的统计性能,它们犯第一类错误的概率与名义水平非常接近;(ⅴ)基于非独立性假设的分层Wald型检验统计量导出的样本量公式也相当精确,其检验的经验功效很接近于名义功效水平。
本文虽然是对流行病学研究中的一些问题进行了研究,但是本文的研究成果可以为列联表的统计推断提供一些有效的研究方法,并能应用于如生物制药等医学研究中的其他领域的研究。