偏正态混合联合模型的统计推断

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:nimin518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
正态分布是统计分析中最常用的分布之一,通常假定响应变量具有对称性。但在经济金融、环境工程等实际领域中,响应变量不满足对称性的问题也很常见。为了研究这类问题,统计学者们提出了许多具有非对称性的统计模型,其中最典型的就是偏正态模型。传统的基于偏正态模型的回归分析大都只对均值参数建模。而在实际应用中存在大量的异方差数据,此时均值回归模型难以有效的拟合异方差数据,因此有必要继续对方差参数建模,即建立联合模型。甚至对偏度参数建模,了解偏度参数的影响因素。此外,在大数据时代,频繁出现的复杂数据对统计建模的要求也越来越高。对于异质总体数据,传统的单一模型难以得到较好的拟合效果,因此发展了混合回归模型。混合回归模型是研究异质总体的重要工具之一,被广泛应用于统计和机器学习中。本文主要研究了以下三方面的内容:第一,对于偏正态异质总体数据,建立偏正态有限混合专家回归模型。考虑到数据可能存在异方差,进一步对尺度参数建模。通过MM算法和EM算法研究了偏正态数据下联合位置与尺度混合专家回归模型的极大似然估计,并给出了算法的具体步骤。最后通过模拟分析和昆明气温数据的实例分析说明了研究模型和方法的效果。第二,在第一部分内容的基础上,对偏度参数建模,提出了偏正态联合位置、尺度与偏度混合专家回归模型。用MM算法和EM算法研究了模型的极大似然估计,并通过模拟分析说明了参数估计的效果。第三,在偏正态异质总体数据下,基于有限混合联合位置与尺度回归模型,研究了变量选择问题。根据三种不同惩罚函数(SCAD、LASSO和HARD)得到对应的惩罚似然函数,利用BIC准则选择合适的调整参数。接着还证明了参数估计的收敛速率,变量选择的一致性及相关的渐近性质。最后对本章所提出的研究方法进行了模拟分析和空气质量指数(AQI)数据的实例分析,进一步说明了研究方法的效果。
其他文献
近年来,载频和波达方向(DOA)联合估计成为阵列信号处理的热点问题。但是随着阵列信号处理技术的发展,对参数估计精度的要求正不断提高,为增加阵列结构的估计精度,最为直接有效的方法就是提高天线数量,但这将导致阵列接收系统的硬件实现成本增加,且现有信号处理接收机采样数据量庞大,使得后续信号处理算法处理数据量越来越多,同样增加了阵列接收系统的实现难度。为了解决该问题,目前存在两个方面的研究:其一为稀疏阵列
动物对其生境的响应是跨尺度的,多尺度分析可以为理解物种的生态格局和生态过程提供重要的理论启示,同时也可以为管理者依据不同尺度制定相应的保护策略提供有效方案,因而对物种保护与管理具有重要意义。水鸟是表征湿地生态系统健康程度的重要指示生物,但其多尺度的栖息地选择机制却鲜少被研究。本研究以东亚水鸟的重要停歇地东北平原为研究区域,对两种种群数量日益减少的水禽——白额雁(Anser Albifrons)和豆
在对空间目标的观测过程中,光波的传播受到随时间变化的大气湍流的随机干扰,使地面望远镜观测到的图像像质退化。为此,现代的大视场自适应光学系统多利用多颗导引星对一定视场内的湍流进行采样。由于大气湍流随时间在不断变化,其随不同高度分布的廓线也会发生时变,因此本论文结合实时变化的大气湍流廓线计算导引星的最优位置对进一步提高自适应光学系统性能至关重要。本文提出采用简化的近地层自适应光学几何模型作为系统性能评
阅读作为一种重要的信息输入方式,在英语学习中有着不可替代的作用。为了找到一种更加有效的英语阅读方式,国内外许多研究者致力于阅读教学模式的研究。Rumelhart在1977年提出了交互阅读模式,它结合了自上而下阅读模式和自下而上阅读模式。近年来,交互式阅读模式已经成为许多语言学家和教育工作者的研究热点。本文以初中生为研究对象,旨在验证交互式阅读模式是否在提高初中生阅读兴趣和阅读成绩方面有效。本研究选
随着中国的快速发展以及汉学热的再一次风靡世界,西方汉学家对于《易经》的研究再次掀起了一股热潮。然而由于《易经》译本的留存方式多为拉丁文版本,缺少法语译本,所以作为《易经》研究必不可少的一个环节,系统研究《易经》的法译存在其深远的意义。本文从分析汉学家Charles de Harlez的译本LE YI-JING:TEXTE PRIMITIF RéTABLI,TRADUIT ET COMMENTé入手
对于离散事件系统,给定一个关于状态的秘密集合,若入侵者不能推断出系统的当前状态是否属于该秘密集合,那么认为系统具有不透明性。在以网络形式存在的信息物理系统中通常系统本身也会引入插入函数等方法来加强自身的不透明性,而这种加强不透明性的方式主要表现为对输出序列的再编码。再者,离散事件系统中也存在很多不可观测事件,这将导致入侵者可能不可以准确地推断出系统当前状态,站在入侵者立场,这样的问题显然需要及时解
随着互联网的迅速发展,情感分析已经成为自然语言处理的研究重点。语义提取和情感分类是解决这一问题的关键途径。面对不断变化的文本表达方式,现有算法的表现不令人满意。要想获得准确的情感分析结果,需要关注文本高层情感语义,需要提取文本多模态语义特征,需要提升情感分类的效果。论文重点研究了文本情感分析中的上述关键科学问题。论文主要工作和创新点如下:为了解决已有的语义提取算法提取结果不完善的问题,本文提出基于
随着深度学习和人工智能的不断发展,各行各业的相关应用也越来越多。目前,传统的监管工作逐步智能化,采用深度学习算法的巡检系统相继被开发出来,并能够对巡检人员和设备进行自动化监管。但是现有的系统往往存在以下不足。移动端由于自身运算和存储能力的限制,系统普遍运行在电脑端,电脑容易受到地点和使用场景的限制,使用起来不方便;OCR模型对巡检工作中仪表仪器图像进行文本检测时,容易将设备上的状态灯错误的检测成文
银联电子便民平台是一个缴纳水电煤等便民业务的在线平台,已于2009年上线。经过近5年运营,发现原有系统存在着用户体验不佳、代码冗余、可维护性不佳等问题,需要进行改造。本研究的主要工作是在充分分析用户需求及现有系统问题的基础上,对现有系统进行重构,增加新功能,以满足用户日益增加的应用需求。改造后的系统是一个基于J2EE的Web系统。该系统优化了原有系统的页面和缴费流程,增加了账单管理、每月一付、账单
青藏高原的形成、演化长期以来都是国际上地质学研究中的热点问题之一,青藏高原所在的地区在不同时期曾发生过一系列的构造运动,经历的地质事件也是多阶段的,包括特提斯阶段的三个阶段以及印度-亚欧大陆碰撞等,这些地质事件所带来的构造运动会使得强烈的岩浆活动出现在洋壳的俯冲以及印度与亚欧大陆碰撞的过程中。本文研究的地区处于班公错-怒江缝合带内,由于班怒带独特的构造格架使得其广泛分布有中生代的岩浆活动,这些岩浆