缺失数据情形概率密度函数的统计推断

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:qf125228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在许多实际问题中,由于各种人为或其它不可知因素,很容易导致大量缺失数据的产生,例如在民意调查,市场调研,医学研究以及社会经济研究等领域普遍存在数据缺失现象.在有数据缺失的情况下,通常的统计方法往往不能直接应用,需要对数据进行必要的处理. Complete ? Case方法是解决数据缺失问题的一种方法,它是将有缺失的数据项删除,然后对剩余的项构成的“完全样本”用常规的统计方法进行推断.填补法也是处理数据缺失问题的方法之一,而填补法是对缺失值进行填补,继而得到“完全样本”,再按照通常的统计方法进行推断,缺失数据情形的统计推断是现代统计界的一个热门研究领域(Little andRubin, Statistical Analysis with Missing Data[M], New York: John Wiley and Sons, 2002).由于客观实际错综复杂,使在统计判决问题中“假定总体服从某分布族”有时并不符合实际.因此,有时需要利用观察数据来直接估计概率密度函数,以便得到总体的某些特征值的较好的估计.对于概率密度函数的研究,目前文献中已有大批研究成果.在完全样本情形,Rosenblatt,Parzen,Loftsgarden & Quesenberry,Wahba,Silverman,Devroye,Devroye &Gyo¨rfi等人对概率密度函数的估计问题进行了广泛深入的研究;在缺失数据情形,Robinset al(Semiparametric efficient estimation of a density with missing or mismeasured covariates [J].Roy. Statist Soc Ser B,57: 409-424)在随机设计及协变量有缺失情形基于参数模型定义了概率密度函数的估计; Wang(Probability density estimation with data missing at random whencovariables are present [J]. Journal of Statistical Planning and Inference,2008,138: 568-587)分别基于校正法和逆概率权法研究了概率密度函数的估计及其渐近性质.本文在第二章中研究了MAR缺失机制下的概率密度函数的估计及其渐近正态性,得到两个结果:(1)将Wang(2008)中的条件减弱(主要体现在扩大核估计的适用范围),证明了基于非参数回归填补法定义的概率密度函数的估计的渐近正态性,并利用此结果构造了概率密度函数的基于正态逼近的渐近置信区间.(2)基于一种新的逆概率权方法定义了概率密度函数的一个新估计,证明了估计的渐近正态性,利用此结果构造了概率密度函数的基于正态逼近的渐近置信区间.本文在第三章中在MAR缺失机制下,首次对概率密度函数的经验似然置信区间的构造进行研究,得到了如下结果:(1)采用非参数回归填补法补足缺失数据,证明了基于此填补法得到的概率密度函数的经验似然比统计量的极限分布为加权卡方分布,利用此结果构造概率密度函数的经验似然置信区间时需要调整,而调整系数需要估计,这会降低经验似然置信区间的覆盖精度.(2)采用逆概率权填补法补足缺失数据,证明了基于此填补法得到的概率密度函数的经验似然比统计量的极限分布为卡方分布,利用此结果构造概率密度函数的经验似然置信区间时不需要调整,从而可以提高经验似然置信区间的覆盖精度.本文的特色体现在以下三个方面:1.将Wang(2008)中的条件减弱(主要体现在扩大核估计的适用范围),证明了基于非参数回归填补法定义的概率密度函数的估计的渐近正态性,并利用此结果构造了概率密度函数的基于正态逼近的渐近置信区间.2.采用新的逆概率权方法定义了概率密度函数的一个新估计,证明了估计的渐近正态性,利用此结果构造了概率密度函数的基于正态逼近的渐近置信区间.3.在MAR缺失机制下,首次对概率密度函数的经验似然置信区间的构造进行研究.采用逆概率权填补法补足缺失数据,证明了基于此填补法得到的概率密度函数的经验似然比统计量的极限分布为卡方分布,利用此结果构造概率密度函数的经验似然置信区间时不需要调整,从而可以提高经验似然置信区间的覆盖精度.
其他文献
近些年来,很多作者证明了大量的不动点定理并应用于各种问题的研究,其中包括一些泛函形式的拉伸与压缩不动点定理.本文第1章对这类研究的现状进行了简要的概述.  第2章首先利
微分方程模型在描述现实世界中的各种现象时起到了非常重要的作用,它从数学的角度阐释了各种系统的动力学模型,使人们科学的认识系统的内部规律,从而可以对系统进行有目的的控制
随着我国经济水平的提高,旅游成为热门需求,旅游管理专业也逐渐成为高职院校的重点专业.本文将深入分析我国五年制高职旅游管理专业课程设置存在的问题,并指出模块化课程模式
随着弹性力学的发展,带有非标准增长条件的椭圆型偏微分方程问题的引起了人们的广泛兴趣。而p(x)增长条件作为非标准增长条件中的一种特殊情况,它被广泛应用于非线性弹性力学、
传染病模型可以被用来研究疾病的传播机制。本文建立一个传染病模型,用来描述由于人口扩散所导致的疾病在各斑块之间传播的动力学系统。并通过分析一类传染病模型的动力学性质
非线性泛函分析作为一门研究性学科,是随着社会的发展和科技的进步,以社会科学和工程技术及自然科学领域中出现的非线性问题为背景而产生的.它的出现不仅具有深刻的理论意义,而
作为数学的一个重要分支,黎曼流形的概念不仅渗透到数学内部的很多领域,在理论物理中也得到了越来越广泛、深刻而富有成效的应用。由于流形上的每一点都有一个邻域与欧氏空间中
重排方法已经成为研究椭圆和抛物方程的一种非常有用的工具.重排方法也称为对称化方法.Talenti首先利用重排方法研究了二阶椭圆方程.至今他的结果已经被广泛的应用和扩展.其
近年来,关于广义保成本控制的研究受到了人们的极大关注,而且取得了较多的研究成果.但对于不确定离散广义系统的保成本控制问题还鲜见文献,目前仍处在初步阶段,本论文利用线性矩
人脸识别技术是模式识别、图像处理等学科研究热点之一。人脸具有不同的属性描述,可以是性别、年龄等。民族面部特征也是人脸重要的属性描述集合,不同的血缘、基因、所处地域