两类统计推断问题

来源 :浙江大学 | 被引量 : 3次 | 上传用户:czd1986624
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要对两类统计推断方法进行了研究.一类是有关随机偏微分方程的参数估计,另一类是有关分布的非参数检验.众所周知,偏微分方程可用于随时间和空间变化的复杂系统的建摸.许多领域中的数学模型都可以用偏微分方程来描述,而实际上,大量现象都是随机现象,因此,自然地将随机分析的方法引入到偏微分方程中,便有了随机偏微分方程(Stochasticpartial differential equations)(SPDE).人们利用SPDE建立有关利率,界面动力学,神经心理学和湍流学等随机模型时,不断地取得了显著的成效,显示了SPDE对于人类认识自然现象和社会现象基本规律的重要性.有关SPDE的概率理论的研究始于上世纪70年代,包括不同类型方程的解的存在性,唯一性以及解的性质等问题,Itǒ(1984),Rozovskii(1990)和Da Prato&Zabczyk(1992)等作了较详细的讨论.有关SPDE的统计推断研究,包括方程的参数估计问题等,则始于上世纪90年代初.Hüebner等(1993)最先讨论了两类特殊的SPDE的参数估计问题,后来,Hüebner&Rozovskii(1995)进一步将结果推广到以下抛物型SPDE其中A0,A1分别是满足一定条件的偏微分算子,θ是未知参数,WQ(t,x)是带有协方差算子Q的Wiener过程.Prakasa Rao(2000,2003)则对下列两种具有特殊偏微分算子形式的SPDE模型作了讨论和其中△=(?)~2/(?)x~2,b(θ)是形式已知的未知参数θ的函数,ε为干扰项.显然,模型(0.0.2),(0.0.3)所包含的参数函数形式比(0.0.1)更具有一般性.当上述方程(0.0.2)和(0.0.3)的解存在时,可以定义为如下形式其中{ei(x),i≥1}是算子Q的正交系,{Ui(t),i≥1)是U(t,x)的Fourier系数.事实上,对于SPDE的参数估计问题,可以从不同的角度进行讨论.按样本资料的性质,可以基于连续样本轨道,也可以基于离散样本观测点来给出参数的估计量;根据参数估计的方法,则有极大似然估计和贝叶斯估计等;有关估计量的渐近性,包括相合性和渐近正态性的讨论,根据实际问题的需要,可以从不同的情形进行研究.例如,Hüebner&Rozovskii(1995)是基于Fourier系数{Ui(t),i=1,…,N}在给定的时间区间[0,T]上的连续样本轨道对方程(0.0.1)中的参数θ给出了极大似然估计,并研究了当Fourier系数的个数N↑∞时估计量的渐近性.而PrakasaRao(2000,2003)则是基于Fourier系数Ui(t)在给定时间区间[0,t]上的离散观测{Ui(tj),tj=j△,0≤j≤n,i=1,…,N},对方程(0.0.2)和(0.0.3)中的参数θ给出了极大似然估计和贝叶斯估计,并研究了当离散观测点数n↑∞时估计量的渐近性.在本文的第一章,我们利用Fourier系数Ui(t),i=1,…,N在给定时间区间[0,T]上的连续样本轨道,对方程(0.0.2)和(0.0.3)中的参数分别给出了极大似然估计.在本章第二节,我们考虑一种新的情形,即当小干扰项ε→0时估计量的渐近性质.Prakasa Rao(2000,2003)在要求方程(0.0.2)中b(θ)<0和方程(0.0.3)中b(θ)>0的条件下得到了参数估计量的弱相合性和渐近正态性.我们除去了函数b(θ)满足符号条件的要求,证明了估计量的强相合性和渐近正态性.在本章的第三节,我们还对模型(0.0.3)的估计量性质作了进一步讨论.证明了当Fourier系数的个数N↑∞时参数估计量的强相合性和渐近正态性.本文研究的另一类统计推断问题是有关分布的非参数检验,包括拟合优度检验和比较多个多元总体分布的检验.有关这些课题的研究,无论是在理论上还是实际应用中都具有非常重要的意义.统计中的许多方法都依赖于正态性的假定.有关正态分布的拟合检验,已有大量的文献做了研究.本文第二章考虑的是一般分布的拟合检验.具体提法如下:设X1,…,Xn是一简单随机样本,有共同分布F(x),x∈Rd,检验假设问题其中F0(x)是形式已知或最多含有几个未知参数的分布函数.对于一元情形的一般拟合优度检验的研究,始于1900年Pearson提出的χ~2检验,后来发展了许多方法,其中的理论都已比较成熟,并得到了广泛的应用.在本章第二节,我们将对各种类型的一元分布拟合优度检验作综合介绍.对于多元情形的一般拟合优度检验问题(0.0.5),直到最近的二,三十年才开始有文献讨论.Shorack&Wellner(1986)和Einmahl&Mason(1992)分别根据经验过程理论对(0.0.5)给出了检验;Justel等(1997)利用Rosenblatt(1952)的概率积分变换(Probability Integral Transfom)将一元情形基于经验分布函数(EDF)的Kolmogrov-Sminorv检验推广到了多元情形.在一元情形的拟合优度检验中,还有一类非常重要的检验,那就是Greenwood(1946),Weiss(1959),Hall(1986)和Balakrishnan&Kamnan(2004)等给出的基于一元间隔(Spacings)的各种检验.由于多元间隔(Multivariatespacings)概念一直没有给出明确的定义,这类基于间隔的检验在多元情形未曾得到推广.最近,Li&Liu(2007)利用统计深度函数(Statistical depth function)给出了多元间隔的定义,并利用多元间隔讨论了多元容许域(Tolerance region)的构造,但没有讨论有关多元拟合优度检验问题.研究表明,统计深度函数和连接函数已经成为多元分析中非常重要的工具.在本章第三节,我们借助统计深度函数,不仅将一元情形基于经验分布函数(EDF)的各种检验,包括Kolmogrov-Sminorv检和Cramer-von Mises型检验,都推广到了多元情形,同时给出了多元χ~2拟合优度检验,并将Li&Liu(2007)提出的多元间隔概念应用到了多元拟合优度检验中.这些检验都是具有仿射不变性(Affine invariant)的非参数检验.同Justel等(1997)给出的检验统计量比较,我们给出的统计量更便于计算.在这一节,我们还讨论了如何将多元分布拟合检验问题转化为有关连接函数的检验.第四节对部分检验作了随机模拟,结果表明,检验具有良好的功效.在第三章,我们继续利用统计深度函数这一重要工具,对多个多元总体的分布比较问题进行研究.众所周知,当各总体都满足多元正态分布时,可以利用似然比检验的思想给出检验统计量.而当正态性不满足时,我们必须考虑非参数检验方法.关于多元两样本的位置参数检验,已有大量的文献作了研究,具体可参见Puri&Sen(1971),Brown&Hettmanperger(1987),Randles&Peters(1990),Choi&Marden(1997),Topchii等(2003)等学者的研究论文.对于多元多样本位置参数的检验,Puri&Sen(1971),Hettmansperger&Oja(1994),Hettmansperger等(1998)和Um&Randels(1998)等曾给出过符号检验,秩检验及中位数检验.考虑下面两类更具有一般性的问题:(1)已知各总体都属于同一位置-形状分布族(Location-scale distribution family),需检验相互之间的位置参数和尺度参数之间是否有显著差异;(2)各总体的分布形状未知,需检验各总体的分布函数之间是否有显著差异.至今,对这些课题研究的文献不多.在多元两样本情形下,Rousson(2002)和Liu&Singh(1993),Zuo&He(2006)分别对问题(1),(2)作过研究.在本文的第三章,我们考虑更具有一般性的多元多样本情形,利用统计深度函数对问题(1),(2)提出了三种非参数检验方法.设总体Xi是概率空间(Ω,F,P)上的d维随机向量,且有未知的连续分布函数Fi(x),x∈Rd,i=1,…,k.Xi={X1i,…,Xnii}是取自于总体Xi的简单随机样本,i=1,…,k,并设不同样本之间相互独立.考虑假设问题H0:F1(x)=F2(x)=…=Fk(x)=F(x)对(?)x∈Rd成立, (0.0.6)若已知各总体的分布函数形式相同,则问题(1)对应的备择假设等价于下列位置-尺度模型其中θ1,…,θk是Rd上的d维向量,且至少存在1≤i≤k,使得θi≠0=(0,0,…,0)’;σ1,…,σk是Rd上的d维向量,且至少存在1≤i≤k,使得σi≠1=(1,1,…,1)’,x/σi=(x1/σi1,…,xd/σid).若各总体的分布函数形状未知,则问题(2)对应的备择假设为H1:存在i≠j和x∈Rd,使得Fi(x)≠Fj(x).(0.0.8)Rousson(2002)利用投影和深度函数,将一元两样本问题的Wilcoxon检验和1967年Mardia提出的有关二元两样本问题的非参数检验推广到了多元两样本情形,对两个多元位置-尺度模型给出了检验.在第三章第二节,我们将借鉴Rousson(2002)的思想,把一元多样本问题的Kruskal-Wallis检验和1970年Mardia提出的有关二元多样本问题的非参数检验推广到多元多样本情形,对模型(0.0.7)给出检验.Liu&Singh(1993)基于数据深度定义了品质指数(Quality index)用它来衡量两个多元分布函数F(x)和G(x)差异大小,其中D(x;F)是x点关于分布函数F的深度.当D(·;·)具有连续的分布函数,且F(x)=G(x)时,有Q(F,G)=1/2.当F(x)和G(x)未知时,取Q(F,G)的估计量为Q(Fm,Gn),其中Fm和Gn分别是对应F(x)和G(x)的样本经验分布函数.当深度函数D(·;·)为马氏深度(MhD),且F(x)=G(x)成立时,Liu&Singh(1993)证明了统计量Q(Fm,Gn)的渐近正态性,有下列结论((1/m+1/n)/12)-1(Q(Fm,Gn)-1/2)(?)N(0,1),当min(m,n)→∞时.(0.0.9)并猜想对一般的深度函数也有该结果.Zuo&He(2006)称统计量Q(Fm,Gn)为Liu-Singh统计量,在深度函数满足一定的正则条件下,证明了Liu&Singh(1993)的猜想,并给出了当F≠G时,Q(Fm,Gn)的渐近分布.在第三章第三节,我们将基于Liu-Singh统计量对模型(0.0.8)提出新的检验,该检验具有仿射不变性.首先,利用Liu&Singh(1993)所给出的品质指数,定义一个新的参数来衡量k个多元分布函数F1(x),…,Fk(x)之间的差异程度.显然,当k个分布函数都相同,即原假设(0.0.6)成立时,λ=0.因此,对于一般的多元多样本问题,即模型(0.0.8),我们自然可取检验统计量为其中Fni是样本Xi={Xii,…,Xnii}的经验分布,Qij=Q(Fni,Fnj),i,j=1,…,k.当λn取值偏大时,我们拒绝原假设(0.0.6).在Zuo&He(2006)所给出的正则条件下,且原假设(0.0.6)成立时,我们证明了检验统计量λn有下面的渐近分布其中W是r个独立的X~2(1)分布的随机变量的线性组合.特别地,当各个样本容量相等,即n1=n2=…=nk=:m时,有最后一节,我们通过随机模拟对本章所给出的三种检验的功效作相互比较.结果表明,广义的Kruskal-Wallis检验,最适合于含有位置参数变动,而尺度参数保持不变或变动相对偏小时的多元多样本问题的检验;当模型中含有尺度参数变动,位置参数保持不变或变动相对偏小时,本章提出的基于Liu-Singh统计量的检验是三种检验方法中表现最佳的,特别是当样本取自于重尾分布时,具有很强的功效.随着样本容量的增大,广义Mardia检验的功效得到显著的提高.本文收录了作者三年来所撰写的部分论文,参见文中的附表.最后,限于作者水平有限,文中难免会有不当或谬误之处,敬请诸位不吝批评和指正.
其他文献
本文讨论了右过程的不变集与吸收集的性质,并且将过分函数,过分测度,常返和暂留的概念分别推广为α≤0时右过程的α-过分函数,α过分测度,α-常返和α-暂留的概念,并给出了一系列的刻画。本文研究了概率测度的矩母函数的性质,用凸分析的方法算出了矩母函数的次微分,并用此完全刻画了C.J.Stone提出的拟对称概率测度的性质。特别地,当概率测度对称或均值为零时,此概率测度是拟对称的。同时我们研究了随机游动和
学位
本文主要分两部分。 第一部分主要研究算子代数上的映射。在第二章和第三章我们给出了算子代数上映射是导子的一些条件。在第四章我们给出了广义Jordan导子和广义Jordan triple导子的定义,研究了素环和标准算子代数上的广义Jordan导子和广义Jordan triple导子。在第五章中我们引进了在离散拓扑、范数拓扑、强算子拓扑和弱算子拓扑下的拓扑自反性,证明了某些算子代数上(α,β)—导
学位
铁基化合物超导体是近期发现的又一类全新的非常规超导体,也是除铜氧化合物超导体后又一类超导转变温度突破BCS理论预言的McMillan极限的超导体。对其机理的研究,无疑有助于理解铜氧化物高温超导电性,也为人们探索更高超导临界温度的超导体增添了信心。本论文在系统地调研铁基超导材料研究现状的基础上,开展了对“1111”相母体材料LaTAsO(T=Fe,Ni)以及"122"相Ni掺杂体系BaFe2-xNi
粒子物理是研究基本粒子及其之间相互作用、相互转化的物理学分支,是研究物质、能量、空间和时间的科学。量子电动力学(QED)是研究电磁相互作用的科学,量子色动力学(QCD)是研究夸克胶子之间强相互作用的科学,他们都是粒子物理的重要研究方向。直接参与强相互作用的粒子称为强子,包括重子、介子和四夸克态等。其中对于重子的形状因子的研究是对于其内部电荷与电流的时空分布等QED性质的描述,也是对于QCD中微扰和
过去十多年来,各种形式的多重zeta函数因其在扭结理论,上同调理论,量子力学等众多方向上的联系与应用而受到越来越多的关注.在过去的研究中,尤以对多重zeta函数的递约和估值占了重要的部分.因此对它们进行专门的研究是非常有意义的.同时我们看到,现在关于多重zeta函数的理论还在快速发展中,而不同形式的多重zeta函数因其在不同方向的应用而引起不同方向学者的关注,使得对它们的研究在过去是相对独立的.本
由于采空区内条件的复杂性,防治采空区及工作面瓦斯爆炸一直是煤矿安全工作的重点和难点,遏制采空区瓦斯爆炸事故对保障我国煤炭能源安全和进一步实现煤矿安全形势的根本好转具有非常重要意义。由于采空区的隐蔽性,人们至今对引发采空区瓦斯燃烧爆炸的点火源类型及特性认识不足,在防治工作中缺少针对性,导致采空区成为近年来国内外重特大瓦斯爆炸事故的主要地点。许多火灾和爆炸案例都归因于难以识别的火源,隐蔽性和原因不明的
这篇博士论文主要研究探测基因与基因互作的统计遗传学方法,提出了研究基因与基因互作的非参数统计模型,并且开发了相应的生物信息学分析软件GMDR。在研究的过程中,我们将以烟草作为主要的实例,特别是人类对尼古丁依赖性将被重点研究。论文共分五章。第一章为引导和概述。第二章进行了APBB1基因的关联分析。我们选取了5枚位于基因内的SNP标记。统计分析表明,APBB1与SQ,HIS,以及FTND存在关联。在混
学位
Scrapie, known as the transmissible spongiform encephalopathy (TSE) in goat, is a lethal neurodegenerative disorder that causes great loss on animal husbandry. The transmissible agent (prion) responsi
学位
此论文包含两部分内容:前三章阐述利用化学交换饱和转移(chemical exchange saturation transfer, CEST)实验获取蛋白质激发态赝接触位移(pseudocontact shifts, PCSs)的研究;第四章阐述利用核磁共振(nuclear magnetic resonance, NMR)对蛋白质-配体弱相互作用的初步研究。蛋白质的激发态构象在蛋白折叠、分子识别、
信息科学是研究信息运动规律和应用方法的科学,近30年来,信息科学与量子力学相结合而兴起的量子信息科学受到了广泛的关注。量子信息科学由于一些新奇特性,比如量子态的不可克隆性、线性叠加性、纠缠特性等,使其在量子计算、量子信息、量子度量等方面显示出十分广阔技术应用前景。量子计算机的并行处理能力使其计算速度远远快于经典计算机,在密码破解、量子搜索等方面展示出了巨大的潜力。量子信息利用量子态不可被克隆性、纠