论文部分内容阅读
传统的多变量统计分析方法,主要是指主成分分析方法、因子分析方法等我们常说的多元统计分析方法。这些方法有个共同的地方就是都会计算样本的均值向量和协方差矩阵,并在这两者的基础上计算其他统计量。当样本数据中没有离群值时,这些方法都能得到优良的结果。但是当样本数据中包括离群值时,计算结果就会很容易受到这些离群值的影响,这是因为传统的均值向量和协方差矩阵都不是稳健的统计量。所以,本文从稳健统计的角度出发,把稳健统计的思想加入到多变量统计分析方法中。在研究了现阶段主流的稳健多变量分析方法基础上,介绍了几种常用的多变量统计分析方法的算法。并利用其中一种,建立了稳健的多变量离群值的检测方法。本文还著重地对现时最流行的FAST-MCD方法的算法进行研究,构造了稳健的均值向量和稳健的协方差矩阵,应用到主成分分析和因子分析中,并针对其不足之处提出改进方法。除此之外,本文还提出了稳健杠杆值,稳健因子得分的计算方法。从模拟和实证的结果来看,改进后的的方法和新的稳健估计量确实能够对离群值起到很好的抵抗作用,大幅度地降低它们对计算结果的影响。最后还把FAST-MCD方法在EXCEL上进行了实现,并做出友好的使用界面。