论文部分内容阅读
“大数据”逐渐的成为很多领域里面热门的话题,例如新闻智能推送,经济学研究,机器学习等。当对高维数据处理时经常遇到“维数灾难”问题。如何从高维数据中有效的提取感兴趣信息是当今统计学研究的热点和难点。其中充分降维是一个重要的研究方向,它可以有效的处理具有稀疏性结构的数据。根据半参数理论和再生核Hilbert空间(RKHS)理论,本文提出了一种新的非线性降维方法一基于RKHS的广义半参数方法(Generalized semiparametric method) 。该方法在RKHS的性质基础上将半参数模型推广到不仅冗余参数为无穷维而且感兴趣参数也可为无穷维的广义半参数模型情形,推导出相应的广义冗余切平面(Generalized nuisance tangent space)之正交补空间,进而构造了降维方向的估计方程,并利用正则化方法完成相应目标函数的求解,求得具有优良性质的非线性充分降维子空间的估计。本文最后进行了统计模拟研究,显示了新方法在有限样本下具有良好表现。