基于模型校准估计的非概率样本统计推断研究

来源 :山西财经大学 | 被引量 : 0次 | 上传用户:HongJuZhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在以往的抽样调查研究中,基于概率的抽样调查处于主导地位,在已知样本入样概率的情况下,通过随机化理论生成目标总体的代表性样本来消除选择偏差,但是随着响应率下降和基于概率的抽样成本迅速增加,研究人员开始转向使用更便宜和更方便的非概率抽样方法来实现所需的样本量。随着互联网的发展,网络调查由于数据收集周期短、调查成本低而受到人们的欢迎,目前已经在市场研究的调查数据收集中占主导地位。在此背景下,非概率样本的统计推断问题已成为网络调查急需解决的问题。解决非概率样本的统计推断问题,有利于促进非概率抽样的广泛应用与网络调查的发展,具有一定的现实意义。模型校准估计法是通过借助辅助信息对样本单元的权数进行调整,来减小样本结构与总体结构间的差异性,用于解决由于样本的随机性而导致的抽样精度低的问题。本文将机器学习方法中的决策树、神经网络、支持向量机、随机森林、Lasso引入模型校准估计并用于非概率样本的统计推断,通过构造非概率样本并结合辅助信息实现对目标总体的估计,并通过两个不同的数据集进行了实证研究,首先通过“是否可以上网”这一变量筛选出可以上网的群体,并将其假设为网络志愿者小组,然后在网络志愿者小组中随机抽取样本来构造非概率样本进行统计推断。本文采用的两个数据集中样本单元目标变量的均值与总体目标变量的均值之间都存在较大差异,研究结果表明:在不同的样本量下,通过模型校准估计法得到的统计推断结果与目标总体的真实结果非常接近,也就是说即使非概率样本均值与实际总体均值存在较大差异,使用模型校准估计法能够很好的解决这个问题,能够实现对目标总体较为准确的估计;通过对五种方法的对比分析发现基于随机森林的模型校准估计量的偏差表现较好,而在方差和均方根误差方面,基于Lasso的模型校准估计表现更好。
其他文献
西藏班戈地区的大地构造、位于班公湖-怒江缝合带以南的北拉萨地体中。此前北拉萨地体尚未见寒武纪岩浆活动的报道,从而限制了对青藏高原形成及演化的深入研究。为更好地认识该微陆块上泛非-早古生代构造热事件并约束其构造演化,本文在详细的野外观察基础上,通过对班戈地区首次发现的辉长闪长岩体精确的锆石U-Pb定年和地球化学研究,分析了原岩时代、性质及成因等,这些新获得的数据对于探讨北拉萨地体的时空演化和地球动力
1目的了解珠海市居民家庭医生签约服务现状,通过调查居民以及基层医务人员对家庭医生签约服务的认知、需求、利用、参与等情况,分析珠海市家庭医生签约服务在推进过程中存在
以氮化镓(gallium nitride,GaN)为代表的第三代宽带隙半导体材料,由于其优良的光学(带隙宽度可调:0.67-6.2 eV)和电学(高击穿电场、高电子饱和漂移速率)特性,已在发光二极管
随着环境能源问题的日益严峻,人们对清洁能源的需求也越来越迫切。氢气作为最理想的清洁能源之一,在许多领域都有非常重要的应用,尤其是作为质子交换膜燃料电池的燃料。通常
随着多媒体技术和互联网技术的快速发展,逐渐产生了大量的高维性数据,这些高维性数据使得图像特征变得饱满,但同时计算机处理起来会变得复杂。这些高维性数据虽然有利于图像的表达,但也会因为信息量过大而造成数据的“维度灾难”,因此,对数据进行降维处理是至关重要的。非负矩阵分解方法是一种有效的降维算法,它强调分解前后的矩阵必须是非负的,并能够自然地表达出“部分构成整体”的思想。然而,传统的非负矩阵分解方法没有
乡镇领导干部在治理基层社会中扮演了重要的角色,随着信息社会的不断发展,提升乡镇领导干部的信息素养已然成为趋势。如何培养和提升信息素养,目前学界已有一些初步的讨论,但
交替传译中的不当停顿现象削弱了译语的信息完整性与表达流畅性,造成听众理解障碍,译员自信心下降,应予以避免与克服。本文以“2019中国(深圳)IT领袖峰会”模拟会议为例,通过对源语以及译语的转写、比对,选出了自己口译中不当停顿的15个典型案例。根据前人的研究,本文分析探讨了案例中不当停顿的表现形式与成因,并提出相应的应对策略。基于学者的理论与实践研究加之笔者的亲身经验,笔者将不当停顿定义为译员由于时
装配式钢丝网架混凝土结构是由预制钢丝网架混凝土墙板、预制钢丝网架混凝土楼板、预制基础梁和构造柱组成的整体结构,其中预制墙板和预制楼板中的钢丝骨架由双向正交的单片钢丝桁架组成,并采用钢丝在相邻桁架之间加密形成三维钢丝网架结构。本文采用有限元数值模拟方法,对该结构的抗震性能进行了一系列的研究,为后期试验的开展起指导作用,并提供相关技术和理论支撑,以便推广装配式钢丝网架混凝土结构在我国低层住宅结构体系中
低温等离子体技术是一种改善纤维表面性能的有效方法,文章讨论了等离子体技术的基本原理及在羊毛纤维表面处理上的应用,采用低温辉光等离子处理和低温射频单电极大气压放电处
目的:本研究通过将中药黄芪甲苷负载有4-乙烯基苯硼酸(PBA)-聚乙二醇二丙烯酸酯700(PEGDA)的超支化聚合物,与巯基化的透明质酸(HA-SH)进行反应,并加入纳米金颗粒,得到芪甲苷负载的HB(PEG-PBA)/HA-SH/GNRs可注射的导电水凝胶。首先检测该复合导电水凝胶的表征及体内、体外释放药物的情况;进而采用结扎冠状动脉左前降支手术制备大鼠心肌梗死模型,将该水凝胶体系原位注射到大鼠心