粗糙惩罚混合Erlang模型在密度估计上的应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:hutao95
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在统计学中,如何较好地拟合一组给定数据的密度函数并给出密度曲线的参数形式一直备受关注。尤其是实际问题中经常遇见的删失数据和多峰数据的拟合,不但要求密度曲线具有高度的灵活性,而且不能出现过度拟合现象,这就大大增加了拟合难度。其中,对于混合模型的研究越来越受到人们的重视,是因为混合模型是一种介于参数方法与非参数方法间的半参数模型,这种半参数模型的优越在于它既避免了参数模型对数据结构的拟合偏离问题又具有分布函数可知等非参数模型无法具备的拟合性质。继Tijims[2]给出证明,在弱收敛的意义下,具有相同尺度参数的混合Erlang模型可以无限逼近任意分布后,利用混合Erlang模型解决金融、保险等行业的数据建模问题有了更加广泛和深入的应用。保险破产理论中,当利用混合Erlang分布对保险损失的严重程度建模时,通常拟合都有良好的表现。混合Erlang分布的密度如下:(?)其中θ是这个混合分布公用的尺度参数。α表示各个Erlang分支在混合分布中所占权重,是个权重向量,满足0<αk≤1,k∈1,…,K,及(?)是分布的形状参数向量,每个分量均为正整数.K是混合模型的序,即分支分布的个数。Lee&Lin[3,4]将Expectation-Maximization(EM)算法引入混合 Erlang模型的参数估计中,其本质就是利用迭代的EM算法估计出模型的参数。由于迭代算法对初值的选取依赖很强,不同的初值选取方法对拟合结果会产生不同的影响。Gui等丨7,8丨利用事先确定的混合个数对数据进行聚类得到初值,再给出BIC准则选出最佳模型的方法来避免序的过度拟合。在Lee&Lin[3]和Yin&Lin[9]文章中,EM算法的尺度参数初值来自于一个非常大的备择空间,通过不断迭代来将表现较差的尺度参数估计剔除。这种方法事先所选参数范围较大,尤其是混合模型的序,很容易出现过度拟合现象。因此本文参考Gui等[7,8]方法来确定迭代初值。混合Erlang模型的线性结构很好的实现了异质性,但是产生了不可避免的问题:混合个数(序)的确定。很多学者讨论过正态混合模型序的确定,主要包括最小距离法,假设检验法,惩罚似然法等。Fan&Li[10]提出应用于线性回归模型的SCAD惩罚函数,通过惩罚回归系数,实现变量选择和回归系数的估计,由于混合模型的线性结构与线性回归结构类似,在Yin&Lin[9]中,类似SCAD惩罚函数,作者提出一种新的关于混合权重向量估计的阈值惩罚函数,iSCAD惩罚。通过惩罚混合权重来确定混合分支的个数,即模型的序选择。并且作者给出了估计量满足稀疏性、连续性和无偏性的证明。但在实际数据的密度函数估计中,该惩罚算法收敛性质受到多个因子的影响,可能会出现收敛速度较慢的现象。基于以上,本文提出另一种惩罚似然函数的观点。受到传统的粗糙惩罚定义的启发,将连续的随机变量密度函数三阶导平方作为惩罚项,粗糙惩罚定义如下如下:(?)在本文第四章中,我们通过模拟数据的例子和实际数据密度估计来证实粗糙惩罚后的序估计要优于未惩罚的序估计。
其他文献
随着我国海洋开发的快速发展,针对船舶、海洋油气平台、海底输油输气管道等水下设备的维修问题日益凸显。水下焊接维修技术是水下设备结构应急维修快速、可靠的方法,其中水下高压干式GMAW焊接技术因其焊接质量好、适用水深范围广,成为水下焊接维修技术的优选方法。在水下焊接过程中,随着环境压力增加(水深增加),焊接电弧收缩,并逐步导致焊接过程趋于不稳定,导致焊接质量下降,这种因环境压力升高造成的电弧收缩问题尚未
当前高功率微波技术的迫切需求之一是将高功率微波源变成实用可靠的系统。高功率微波源在运行中将电子束的能量转化为微波能量,在这一过程中往往需要外加磁场引导电子束的稳
目的:构建一种同时表达sh RNA和蛋白质的双功能慢病毒表达载体,并利用该载体研究TFIIAγ基因突变对基因转录的影响。方法:1.利用基因克隆方法对原载体p LV-U6-sh RNA-EGFP-Pu
马铃薯Y病毒(Potato virus Y,PVY)是对我国危害最为严重的马铃薯病毒之一,其不仅危害我国马铃薯产业,还对我国的烟草产业也造成巨大影响。作为RNA病毒,其变异性强,目前已经演
本学位论文主要研究带变量核的奇异积分和分数次微分在几类重要空间上的有界性.主要结果如下.节首先建立了卷积算子Tm,j在齐次Morrey-Herz空间上的有界性,进而利用单位球面的
由于回旋行波管具有输出功率高、工作频带宽等优点,在军用高分辨率成像雷达、非致命性武器、毫米波通信和电子对抗等领域中得到广泛的应用,而这些应用都要求其能够长时间持续
简单图G的一个全k-标号是指一个映射λ:V∪E→ {1,2,…,k}.它被称为是G的一个点非正规全k-标号,如果对于图G的任意两个不同的点x和y来说,wt(x)和wt(y)是不同的.其中图G的任意
中国传统民居是我国重要的民族文化遗产,其深厚的文化内涵成为近些年绘画创作的热门题材。怀念故土、追寻人与自然的和谐相处、各地特有的民风民俗,民居形式美学都促使着传统民居成为重要艺术载体。通过对优秀民居绘画作品的借鉴与吸收,结合自己在创作实践中的真实感受,针对湘南民居的产生环境、历史发展,探究湘南民居题材在艺术作品当中所蕴含的艺术特色和形式语言。传统文化题材版画在历史的进程中不断发展,在题材的选择与作
行波管自研制成功以来,在国民经济与国防建设中,已经取得了举足轻重的地位。为此,研制高效、可靠的行波管是当前以及将来国民和国防关注的焦点。实际中,行波管的研制主要分为
随着电力系统的不断发展,电能的应用领域不断增多,使得人们对电力系统稳定性的要求也越来越高,快速、有效地对系统受扰后未来的稳定性进行准确预测已成为保证电力系统安全稳定运行、提升电能供应可靠性的重要手段之一。近年来,同步相量测量装置和人工智能技术不断发展,使得许多机器学习方法被应用于暂态稳定预测当中,给问题的解决提供了一种新的思路。然而,由于机器学习处理数据的能力有限,因此该方法仍然存在很多局限。为了