论文部分内容阅读
本论文所讨论的大维数据两样本均值检验是针对数据集维数和样本量都趋于无穷的情况。这是在很多实际的统计问题中,非常令人感兴趣的研究课题;当今计算科学的发展也为大维数据的统计研究提供了可操作性。Bai and Saranadasa(1996)给出了一个两样本均值检验统计量,然而BS检验统计量着重处理全局检验。如果全局原假设被拒绝,我们无法得到个别均值成分显著性差别的任何信息。在着重处理多重检验的mico-array中,这是一个严重的弱点。
两个著名的多重检验分别为由Bonferroni提出的基于控制family-wiseerror rate(FWER)的方法以及由Benjamini and Hochberg(1995)提出的基于控制false discovery rate(FDR)的方法。
本文旨在比较BS统计量与此两种多重检验方法。基于同样的数据生成机制,我会提供详细的模拟设计以及模拟结果。着重点在于比较样本量和数据维数的上升对于power的影响。