回归系数的混合估计和最小二乘估计的相对效率

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:l309553042
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
线性模型中参数估计的相对效率是近年来讨论较多的一个问题,在线性模型的参数估计类中,比较常见的有两种,一种是参数的最佳线性无偏估计(BLUE), 另一种是参数的最小二乘估计(LSE). 首先,、我们考察以下两个线性模型: y=Xβ+e,E(e)=0,Cov(e)=σ<2>I, (1)y=Xβ+e,E(e)=0,Cov(e)=σ<2>V. (2)在模型(1.1.1)下可估函数Cβ的BLU估计就等于LS估计,但是在许多 实际问题中,经过残差分析后我们不能认为对误差向量的假设是合适的.它们的 误差方差可能不相等,也可能彼此相关,此时协方差阵为Coy(e)=σ<2>V,那么此 时真正的模型就是模型(1.1.2).在此模型中,当矩阵X列满秩时,β是可估的,其最小二乘估计是<β^>=(X′X)<-1>X′Y,而BLU估计是β<*>=(X′V<-1>X)<-1>X′V<-1>Y.但是在一些理论和实际应用问题中,V往往包含一些未知参数.若记这些未知参数为θ,对于这种情况,我们需要用θ的某种估计来代替β<*>中的θ,这就导致了所谓的两步估计.遗憾的是,目前我们对两步估计的统计性质,特别是小样本性质所知甚少.另一方面,在某些情况下,我们根本无法得到的θ的任何估计.正是由于这些原因,人们往往不得不回过头来使用最小二乘估计<β^>,用LS估计替代BLU估计就要蒙受一些损失,有时这种损失可以是很大的,因而研究这种损失的大小显得尤为重要.鉴于此,人们提出LS估计相对效率的概念. 从不同的准则出发,可以定义不同的相对效率.在模型(2)中当矩阵X满秩时,β是可估的,其最小二乘估计为<β^>=(X′X)<-1>X′y,其BLU估计为β<*>=(X′V<-1>X)<-1>X′V<-1>y,<β^>对β<*>的一种相对效率定义为二者的广义方差之比,即易见0≤e<,1>(<β^>)≤1,e<,1>(<β^>)愈接近于1,用LS估计替代BLU估计在估计精度上所蒙受的损失就越小;相反e<,1>(<β^>)愈接近于零,这种替代在估计精度上的损失就越大.但这种定义方式存在一个明显的缺陷,即e<,1>(<β^>)对设计矩阵X的依赖性较弱,为了弥补这种不足,1989年刘爱义、王松桂提出了一种新的相对效率: 黄元亮、陈桂景在1998年引入另一种相对效率:陈孝新在2004年引入了另外一种新的相对效率:之后,许多学者又对几种相对效率之间的关系以及它们的上下界进行了研究,得出了相应的结果. 本文主要讨论了在具有附加信息的线性回归模型中,回归系数的混合估计和最小二乘估计的相对效率问题,在误差矩阵为正定的数量矩阵时,定义了一种新的相对效率,讨论了新的相对效率与其它相对效率的关系,并导出了它的上下界;在误差矩阵为一般的正定矩阵时,提出了一种新的相对效率,给出了它的下界.我们主要得到如下结果. 定理2.2.1-2.2.4
其他文献
计算机网络日益发展成为一个大型的不确定性动态分布式系统,现有的各种网络数据管理方案都已不能有效地满足当前数据统计及管理的需要,计算机网络数据管理正面临着新的挑战。
模糊积分是一种融合工具,用以提高多分类器融合系统的分类精确率和改善系统的稳健性。在基于模糊积分的多分类器融合系统中,模糊测度对融合系统的性能有很大的影响。若模糊测
随机微分系统的鲁棒稳定性和可控性是稳定性理论和控制论中的一个重要课题。马尔可夫过程是一类最重要的随机过程;另一方面,在现实中我们经常遇到系统参数的不确定性和及时间延
工程调度问题在现实中有着广泛的应用,包括建筑业,新产品的研发与生产,资本市场的中长期投资,服务系统,软件包等等。最近,工程调度已经被成功地应用到制造业的JIT和现代物流的管理
Willis环脑动脉瘤系统是一类近些年来才发展、建立起来的具有代表性的非线性生物系统,其建立在临床观测和体外模拟实验之上,具有较强的生物和医学背景。该系统以脑动脉瘤内的血
虽然研究多复变自守形式理论已近百年,但作用于一个非管状域的有界对称域上的群却很少被知道。因而n维超球上自守形式少有研究,本文致力于3维超球上尖点形式空间维数公式的计算
学位
隐式代数曲面拼接问题是CAGD中的基本问题之一,尽管低次代数曲面在CAGD中一直被广泛的应用着,但直到七十年代末,构造性代数几何有了突破性进展,曲面拼接问题才有了比较完善的理论
现代科技的发展带动社会生活水平的整体提高,日常生活与科技发展息息相关.随着各种系统和网络的日趋复杂,人们在依赖科技的同时也对系统的可靠性提出了更高的要求,比如对各种风险
粗糙集是一种描述不精确、不确定知识的数学工具,最初是由Pawlak.Z于1982年提出来的,该理论是一种有效的分析和处理不一致、不精确、不完备等各种信息的数据分析工具,知识约