论文部分内容阅读
广义线性模型是统计学中非常重要的模型之一,它在生物、经济、医学、社会等领域有着广泛地应用。在实际建模过程中,一开始往往选择的自变量较多,如何从中选取真正对因变量有关系的变量,是变量选择研究中关心的问题.因此讨论广义线性模型下的变量选择,具有较强的应用价值和实践意义.本文主要借助自适应弹性网估计方法讨论广义线性模型的变量选择问题。首先给出广义线性模型下参数的自适应弹性网估计方法;然后借助此估计方法,给出广义线性模型的变量选择算法;接着从理论上给出广义线性模型下自适应弹性网估计方法的统计性质,如渐近正态性、弱相合性、稀疏性及组间效应等,通过这些性质说明自适应弹性网估计满足Oracle性质,且能够解决变量间具有很强相关性的变量问题;最后通过模拟与常用的变量选择方法,如岭回归、Lasso、自适应Lasso和弹性网估计方法进行比较,模拟结果显示,在BIC准则下,自适应弹性网估计方法比其它常用的变量选择方法有一定的优势,即其选择出来的模型更接近于真实的模型。