论文部分内容阅读
密度函数的非参数估计问题一直很受关注,有关该问题的方法和理论也已较为丰富。在密度函数的非参数估计的诸多理论中,核密度估计和局部多项式对数似然方法尤其受到重视。其中,核密度函数估计是许多非参数密度估计的基础,而局部多项式对数似然方法可以有效地降低边界偏倚。虽然非参数方法对异常点通常没有参数方法那样敏感,但评价一些因素(如:数据点)对密度估计的影响仍是必要的。本论文针对基于高斯核函数的核密度估计和局部多项式对数似然法,提出了一种局部影响分析方法。考虑到上述两种密度估计都基于局部平滑技术,该局部影响分析方法不仅被用于评价数据点的局部影响,而且对某些相互靠近的数据点组成的数据组,也可进行影响评价。为了避免强影响点之间的掩盖效应,我们提出的方法建立在对数据点(或数据组)的联合扰动的基础上。由于上述两种密度估计均不依赖于参数似然且其推断结果是函数而非向量,因此,基于参数似然的局部影响分析方法(如:基于似然位移的方法)和针对向量型统计量的方法(如:广义Cook统计量)均不适用于这两种密度估计。本文提出的方法是基于一个密度位移函数,该函数用于度量扰动前后密度函数估计的差异,可视为似然位移函数在非参数密度估计问题下的推广。在似然位移函数下定义的许多概念也可推广到密度位移函数中来,如:影响图、扰动方向,升截线、法曲率、最大影响方法、影响总计向量等。在密度位移函数下的理论框架中,最大影响方向和影响总计向量仍然均可用作影响评价统计量。对核密度估计和局部线性对数似然法(作为局部多项式对数似然的一个例子),本文均给出了升截线法曲率的具体表达式,发现它们是扰动方向的二次型,而这意味着,最大影响方向和影响总计向量均可很容易地由该表达式获取。在依据上述方法进行影响分析之前,我们使用一个基于扰动向量张量矩阵的扰动选择方法进行扰动量恰当性的评估和扰动量的调整(如果必要)。扰动选择的结果表明,在对数据点的联合加权扰动模式下,原始的扰动向量是恰当的,而在数据组的联合加权扰动模式下,原始的扰动向量并不恰当,我们使用了一个扰动向量的变换对扰动量进行调整。文中进行了一个模拟分析,用以验证和说明所提出的方法。在模拟范例中,单个的异常点对密度估计的影响非常轻微,而当其置身于一个与其相邻的异常点构成的数据组中时,其影响变得非常强烈。对数据组的影响评价结果也揭示了类似的规律。