两类半参数回归模型的模型平均研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:jianjian1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模型平均是近年来统计学研究的热点话题,它主要利用一定的权重将来自不同模型的估计或预测组合起来.通过选取适当的权重,可以有效地提高估计或预测的精度.模型平均主要分为贝叶斯模型平均(Bayesian model averaging,BMA)和频率模型平均(Frequentist model averaging,FMA)两类.由于BMA需要确定各模型的先验概率,因此,越来越多的学者关注FMA.对FMA的研究主要关注两个方面:一方面是探究模型平均估计量中最优权重的选取问题;另一方面是讨论模型平均估计量的极限分布,并据此构建统计推断理论.半参数回归模型是在线性模型和非参数模型基础上发展起来的统计模型,近年来受到统计学者们的广泛关注.本文主要探究两类半参数模型(即部分线性变系数模型和部分线性模型)的模型平均问题,既包含对模型平均估计量渐近最优性的探究,也包含对模型平均估计量渐近分布的讨论.本文具体研究内容包括以下四部分:(1)对于半参数部分线性变系数模型,首先采用一般序列方法估计模型中未知参数,得出响应变量均值的模型平均估计量.再利用“去一”交叉验证法(Cross validation,CV)选择出模型平均估计量中的权重向量,得出JMA(Jackknife model averaging)估计量.为了便于计算和理论研究,构造了计算响应变量均值“去一”估计量的快捷计算公式.在一定的正则条件下,证明了模型平均估计量的渐近最优性.模拟研究不仅说明了所探究的JMA估计量优于传统的模型选择和模型平均估计量,而且验证了快捷计算公式在计算效率方面的优越性.最后将所研究的方法用于分析CD4数据集,以说明所研究方法的实用性.(2)对于纵向数据下的半参数部分线性变系数模型,首先利用基函数展开和广义估计方程(Generalized estimating equation,GEE)得出全模型和各候选子模型下未知参数的估计量.再根据子模型下线性部分参数估计量与全模型下线性部分参数估计量的关系,构造出各候选子模型下线性部分参数估计量的渐近性质,推导出FIC(Focused information criterion)模型选择方法的基本公式,构造出SFIC(Smoothed FIC)模型平均估计量,得出此估计量的极限分布,并为兴趣参数构造了覆盖概率趋近于名义水平的置信区间.模拟研究说明了无论工作相关结构是否错误指定,所研究的SFIC模型平均步骤均优于传统的模型选择方法.最后,将所研究的方法应用于分析CD4数据集.(3)对于部分线性变系数分位数回归模型,利用样条近似变系数函数,通过极小化分位数损失函数得出各候选子模型下线性部分参数的估计量,构造出兴趣参数的模型平均估计量,得出模型平均估计量的渐近分布,并据此构造了覆盖真实兴趣参数的概率趋近于名义水平的置信区间.模拟研究说明模型平均估计量优于传统的模型选择估计量.(4)对于协变量缺失下的半参数部分线性模型,利用逆概率加权法得出各候选子模型下未知参数的核估计量,并得出估计量的渐近分布.根据兴趣参数估计量的渐近分布构造出FIC模型选择方法,得出模型平均估计量及其渐近分布,并为真实的兴趣参数构造了合适的置信区间.模拟研究说明了构造的模型平均估计量优于模型选择估计量,最后将所研究的方法应用于分析豚草花粉水平数据.
其他文献
婴儿配方乳粉是以母乳为“黄金标准”来研发的,是非母乳喂养婴儿的主食,营养成分母乳化是婴儿配方乳粉生产的关键技术,其中对蛋白质研究相对成熟,而脂质因成分复杂,一直是行业公认的研究热点和难点。本研究针对目前我国母乳脂质数据库缺失、婴儿配方乳粉脂质母乳化程度低和脂质易氧化及产品速溶性不理想等行业共性问题,通过对浙江省不同泌乳期母乳中脂质组成和脂肪酸组成及位置分布进行分析,初步建立了成熟母乳脂质数据库,依
学位
受Gabor分析中Ron-Shen对偶原则及Wexler-Raz双正交关系的启发,2004年,Casazza,Kutyniok与Lemmers首次在一般Hilbert空间中引入了R-对偶的概念.到目前为止,R-对偶的研究已远远超出Gabor分析的范围,在数学上有其独立的意义,已成为抽象空间标架理论的一个重要研究方向.另一方面,过去三十余年,直线上的小波与Gabor标架的研究已取得丰硕的成果,而半直
学位
食品安全一直是社会各界关注的热点问题,而细菌性感染则成为导致食物中毒事件发生的关键因素之一,因此挖掘安全高效的食品抗菌剂具有重要意义和应用价值。甘露糖赤藓糖醇脂(Mannosylerythritol lipid-A,MEL-A)是一种天然的新型糖脂类表面活性剂,具有多种理化特性和生物活性,但其对食源性致病细菌如革兰氏阳性菌的抗菌活性鲜有报道,极大限制其在食品微生物安全领域的应用发展。本学位论文以常
学位
胰腺癌(pancreatic cancer,PC)是一种恶性程度极高的消化道肿瘤,在恶性肿瘤引起的死亡率中排名为第七,其发病率呈现逐年上升趋势。直至目前,患者的5年生存率仍然达不到30%,所以展开胰腺癌的形成和进展机制研究极为重要。TSPAN1(Tetraspanins 1)属于四跨膜区域超蛋白家族(transmembrane4-superfamily,TM4SF)的一员,研究发现TSPAN1在胰
学位
深度学习(Deep Learning,DL)基于多层网络结构来提取数据中的层次化特征,可使计算机通过简单概念构建复杂概念。与传统的机器学习不同,DL可在数据中抽取有效的特征表示,获得较高的处理性能,因此,它在多个领域获得了广泛的应用。深度信念网络(Deep belief network,DBN)受人脑认知推理过程启发产生,是迄今为止DL应用最为成功的深度模型之一,它由若干个受限玻尔兹曼机(Rest
学位
发展安全、高效的锂离子电池是解决我国环境和能源危机的重要途径,也是实现电能资源合理配置和产业升级的必由之路。MoS2等过渡金属硫族化合物(TMCs)通常具有转换-赝电容协同嵌锂(吸附)机制,且片状结构能够缓冲充放电过程中的体积变化,是一类优良的锂离子电池负极材料,但循环稳定性差是其现阶段亟待解决的首要问题。一般认为,导电性差和体积膨胀率高导致了循环寿命问题。由于MoS2的失效机制缺乏更加系统的研究
学位
煤在低温氧化过程中,一旦脱水升温会加速,甚至发生自燃,但是水份在其中的影响作用机理尚不清晰,因此研究水份在此过程中的影响作用机理对煤自燃灾害预测预报和防治都具有重要意义。通过干燥称重和工业分析测试了煤中水份,分析了其主要影响因素。煤中外水和部分可室温干燥脱除内水是自由水,其余室温干燥不可脱除水是结合水。自由水含量受煤的性质、外部环境、开采技术条件等因素影响,其他条件相同时,与表面裂隙占比正相关。常
学位
可见光氧化还原催化反应和有机电化学催化合成反应均通过单电子转移过程产生活性自由基或自由基离子,光化学催化以“光子”作为反应试剂,有机电化学催化以“电子”作为清洁的试剂。由于相似的活化方式,许多在光化学催化条件下实现的化学转化在电化学条件下也可以实现,反之亦然。然而,光化学催化合成和有机电化学催化合成方法经常被认为是一种竞争的策略。光电化学结合的催化合成策略在化学转化中的独特优势,通过一系列具有实例
学位
超分子自组装化学是一门快速发展的交叉学科,它涵盖了化学、生物学、物理学等特征,并且已经逐渐发展到新的科学领域。在本文中,我们科学的设计合成了十种同功能性有机配体,通过运用配位驱动自组装的思想和金属组装子导向可编程自组装的方法,报道合成了一系列基于功能性配体的超分子配合物,这些功能化的金属有机超分子化合物在光功能材料、催化等方面有着潜在的应用。在第二章中,我们设计合成了两种新颖的蒽基双(β-二酮)配
学位
人工神经网络是模拟人脑信息处理过程的智能计算系统,因具有自我学习和良好的非线性逼近能力,在非线性系统建模中得到广泛的应用。但在实际应用中,很多实际过程是复杂的非线性动态过程,具有复杂性、非线性、不确定性、时变性等特征,单一神经网络存在灾难性遗忘问题,无法有效学习所有样本等问题,因此非线性动态系统的建模和预测是神经网络模究的难点和热点之一。模块化神经网络是基于大脑的“模块化”特征设计的,可以有效提高
学位