论文部分内容阅读
在实际调查研究中,常常有必要得知研究总体所关心指标的总体特性,如研究变量总值、均值等.简单估计固然简单,但常伴随着估计量精度不高,当存在缺失数据情形时,更是如此.以提高已有总体参数的估计量精度为目标的改进研究是一个不断深入的课题.大量文献指出,有效运用辅助信息可以提高调查精度.当存在已知的、可利用的辅助信息时,不等概率抽样设计下估计量精度较高,其中n=2时严格πps抽样设计是典型的不放回不等概率抽样.如何实施n=2时的严格πps抽样设计,并计算该设计下的一阶、二阶入样概率等问题,是本文展开研究的另一个内容.首先,在现实调查中,常常可以获得已知的辅助信息,当与研究变量呈正相关关系时.合理运用这些辅助信息,如总体均值、变异系数、峰度系数、偏度系数、相关系数等,可以对提高估计量的精度起到很大帮助.由于记录员大意、个人不肯吐露信息等原因,抽样调查常常不可避免的遇到数据缺失的情况.本文将基于含缺失数据情况时,利用辅助变量的峰度系数、偏度系数提出了一系列总体均值估计量,并利用泰勒级数展开求得提出估计量的均方误差和偏倚公式.另外以均方误差作为精度的刻画标准,从理论上比较了提出估计和已有估计的优劣性,获得了优于已有估计的条件,并基于公式和蒙特卡罗模拟验证了这些估计量的有效性.其次,受到Deshpande and Prabhu(1982)提出设计的思想启发,本文构造了一种新的n=2时的严格πps抽样设计.当辅助单元大小符合1 2iX X(27)时,提出的新设计不仅容易实施,而且一阶和二阶入样概率计算简单.此外,本文还获得了H-T估计量的一个非负的方差估计.通过数值比较提出设计和严格πps抽样设计,说明提出方法具有潜在应用价值.最后,由本文提出的新的n=2时严格πps抽样设计出发,建立每层采用n=2时严格πps抽样的分层抽样理论,并基于实际数据集评价其精度。