线性模型回归系数的一种有偏估计——综合C-K岭估计

来源 :山东大学 | 被引量 : 0次 | 上传用户:bisha1007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于线性回归模型的参数估计问题,由于最小二乘估计所具有的许多优良性质,使它一直是最具影响力、应用最广泛的参数估计方法,处于回归参数估计的核心地位。但是随着电子计算机的飞速发展,线性回归模型被应用于更多的领域,用之解决的问题越来越复杂,涉及到的变量也越来越多。这就不可避免的会出现选择的变量多余、赘余、漏选、少选的情况,从而使选择的变量或随机干扰项出现序列相关性、异方差性、多重共线性等问题。当这些问题存在的时候,如果仍然使用最小二乘估计进行参数估计的话,就会使估计的参数值不稳定、经济意义不明确,有时甚至会出现严重的原则性错误。因此,统计学家们就针对这些问题,或是提出改进最小二乘方法,或是创造新的参数估计方法。这就促进了有偏估计的产生。  本论文是针对回归自变量之间存在的多重共线性问题,综合前人提出的岭估计(或广义岭估计)和Stein压缩估计,获得了一种新的有偏估计方法——综合c-K岭估计。我们不仅给出该估计方法的定义,还证明了该估计具有的一些基本性质(如线性性、有偏性、压缩性等)和优良性质(相对于最小二乘估计和岭估计的优良性、可容许性等)。最后,我们给出了综合c-K岭估计的参数c和K的两种选取方法,一种是用典则形式下回归系数的无偏估计和随机误差的方差的无偏估计来计算出参数c和K;另一种是通过迭代方法计算得出回归系数的迭代解,并说明了该迭代解是不依赖于岭参数c和K的。  在本论文的最后,我们利用新给出的综合c-K岭估计方法,研究了山东省城镇居民的消费水平问题。根据理论知识和以往经验,选取了7个与城镇居民消费水平有关的指标,并从山东省统计局网站获取了1984年-2012年间的相关统计数据。在对这些数据进行了简单的处理以后,建立了线性回归模型,并分别用最小二乘估计、岭估计和综合c-K岭估计进行了参数估计,得到相应的经验回归模型。最后通过对得出的3种不同的估计进行比较,验证综合c-K岭估计的优良性。
其他文献
曲线曲面构造是计算机辅助几何设计的一个关键领域。由于能够为复杂的自然现象提供一种很好的确定性表述,分形插值成为人们处理高度不规则数据的强有力工具。现有的大多数分形
本文中不加特殊说明,所有图都是有限简单图.分别用V(G),E(G),△(G)和δ(G)来表示图的点集,边集,最大度和最小度.本文主要研究与四色猜想和图的非正则强度有关的图染色问题,主要包括
本文分类了所有内交换子群同阶的亚循环p群,分类了所有非正规内交换子群的正规闭包是极大子群的亚循环p群。
本文研究耦合的Stokes流和Darcy-Forchheimer流问题的一致稳定的混合元方法,根据同一元的思想使用P1的非协调Crouzeix-Raviart混合元函数近似流体的速度,使用分片常数函数近似
本文介绍最大度为4的图的列表强边染色问题的相关结果。  设G是一个图,E(G)与V(G)分别表示它的边集与顶点集。设v∈V(G),则点v在G中的度数表示为dG(v),图G的最大度和最小度