论文部分内容阅读
在社会经济调查中,经常需要了解所研究总体关于关心指标的总体统计特征,如总体总值或者均值等.简单估计虽然简单,但往往估计精度不高,尤其是存在缺失数据的情形下,更是如此.因此,如何改进已有总体参数的估计精度是一个从未间断的研究课题. 众所周知,合理地使用辅助信息可以改善调查精度.存在辅助信息可以利用时,不等概率抽样设计效率较高,其中个体包含概率与辅助变量规模成比例的πPS抽样是代表性的不放回不等概率抽样.如何实施πPS抽样设计,及能够计算或近似计算该设计下个体的包含概率也是一个研究热点.本文针对上述问题展开研究: 第一,实践中,常可以获得与研究变量呈正相关的已知的辅助变量.基于充分挖掘辅助变量提供的信息,包括辅助变量的总体均值、分位数、峰度系数、偏斜系数、相关系数等的思想,本文提出了一类新的比率型总体均值的估计量.该类估计是利用了辅助变量提供的两个方面的信息对已有估计的改进.通过泰勒公式导出了它的均方误差,并与简单估计、传统比估计及已有的估计进行理论比较,得到精度优于其它估计量的条件.借用蒙特卡洛方法模拟数据,进一步验证该类比率型估计量的有效性. 第二,针对抽样调查常常不可避免的出现缺失数据,原因可能是调查内容敏感或调查者粗心等.对于缺失数据通常采用忽略或插补的方法处理.本文基于含缺失的样本数据提出了一系列总体均值估计量.该系列估计量利用了辅助变量的变异系数对总体均值进行估计,并且使用泰勒公式计算偏倚和均方误差.以均方误差作为精度的度量,理论上比较了提出估计与已有的经典估计,获得了效率高于已有估计的条件,并通过一个实际例子验证这些估计量的有效性. 第三,Jens Olofsson(2011)设计了2PπPS抽样设计,该设计是一种近似的样本容量固定的πPS抽样设计,同时给出了能够计算2PπPS抽样设计下一阶和二阶包含概率的算法. Zaizai(2013)提出了另外一种近似的非拒绝的样本容量固定的πPS抽样设计,该设计被称为AP抽样设计.本文给出了AP设计的计算包含概率的算法.该算法使用递归的方式得到一阶、二阶包含概率精确表达式,使用Horvitz-Thompson估计量估计总体均值,同时获得该估计量在AP抽样下的方差.最后使用三个实例在数值上比较了AP设计与一些经典不等概率抽样设计以及简单随机抽样的精度.实例表明AP抽样设计的效率高于其它抽样设计.