变量分离算法及多元响应变量回归问题的研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:dai818wei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,数据的类型也越来越多。多元响应变量问题的应用场景不断增加。目前有越来越多的学者开始对多元响应变量问题的进行研究,而且也取得了很大的进展。而减秩回归是多元响应变量回归中的重要工具。而当数据维数较高,响应变量之间存在除协变量之外的相依性,或当在观测数据中存在异常值时有很多对应的方法被提出。然而却没有一个统一框架和算法来解决。而多标签分类也是一种多元响应变量问题。只是其响应变量都是二分类变量而已。虽然已经有很多算法来解决多标签分类的问题,但总会存在不同的问题,本文提出了一个新的研究多标签分类的框架。变量选择是近些年一直被大家广泛研究也应用广泛的统计方法。有许多统计学家提出了多种不同的惩罚函数来得到更好的统计性质,针对各种惩罚函数有许多不同的算法被提出,而近两年提出的正交EM算法是一种新的且很有创新型的算法,可以用它来解决带惩罚的线性模型。而我们尝试着将这种想法推广到带惩罚的一般损失函数上去,并将其称为变量分离算法。另外零一膨胀泊松回归模型也被提出和研究,并且基于变量分离算法的想法提出了一种广义EM算法(GEM)来求解.主要内容如下:(1)使用变量分离算法加速求解带非凸惩罚函数的最优化问题。从一个新的角度对OEM算法进行了回顾。针对线性回归模型的最小二乘以外的一类更一般的函数,提出了一种新的算法。证明了生成序列的收敛性并使用Barzilai-Borwein(BB)准则和Nesterov’s方法来加速我们的算法。通过模拟和真实数据分析,以证明该方法的有效性。(2)研究了带有协方差估计的稀疏稳健减秩回归。减秩回归是多元响应变量线性回归模型中的一个非常重要的方法。针对具体不同的情况许多统计学家提出了对减秩回归的改进,而没有一个统一的框架,本文就是考虑了多种不同情况同时发生时减秩回归的建模和估计问题。且应用了区块坐标下降的算法来求解目标函数并且在这一步中用到了变量分离算法。实例和模拟都表明了新方法的有效性。(3)研究了一个新框架下对多标签分类问题的研究.我们考虑用非凸稳健损失函数来减少标签错标的影响。其次我们使用了一种附加的超参数化方法来捕获任何损失函数的标签之间的相依性。然后通过惩罚函数和减秩回归的方法来处理特征矩阵维数较高的问题。最后,统计模拟数据和实际数据分析表明了我们方法的有效性。(4)零和一膨胀泊松回归模型。我们针对零和一同时过多的计数数据提出了零和一膨胀泊松回归模型。然后得到了零和一膨胀泊松回归模型的最大似然估计和贝叶斯估计。而且基于变量分离算法的想法提出了一种新的广义EM算法来求解零一膨胀泊松回归模型。通过模拟研究对各种方法进行了比较。最后通过一个实际数据分析,表明了该方法的实用性。
其他文献
本论文共包括三个课题:1.平均哈密顿的符号计算平均哈密顿理论(也被称为相关平均理论)1968年由Haeberlen和Waugh提出,可以用统一的方式来解释核磁共振中各种实验。它是核磁共振这历史上最重要的理论之一,通过引入一个Toggling表象,人们可以把射频场的作用从主哈密顿中分离出来,使得计算样品自旋的相互作用就能得到密度矩阵的演化。平均哈密顿理论已经被成功地应用于多脉冲、固体回波、交叉极化动
本篇博士论文主要研究了几类时变过程满足的奇异扩散方程.全文的主体分为四个章节.前面三章主要讨论了非耦合时变过程.最后一章研究了耦合的情况.前面三章的父过程是一般Levy过程或者由(分式)布朗运动驱动的随机过程,时间过程均涉及到逆调和稳定从属过程Sα,λ(t).第四章构造了一类新的耦合时变过程并讨论了它的控制方程.第一章我们给出了调和稳定从属过程Tα,λ(t)的Levy测度,构造了算子Φt并详细分析
本文致力于研究不确定奇异系统的鲁棒无源,鲁棒ISS分析和控制的问题。奇异系统是由微分方程和代数方程所组成的一类动力系统,它产生于广泛的工程应用中,例如,化学工程系统,电器力学系统,力学建模,飞行建模和经济系统等诸多应用。过去四十年,奇异系统的分析与控制已经发展成为系统严格的理论体系。然而,不确定性在系统建模中总是存在的,奇异系统的鲁棒控制仍然需要进一步探索和改进的。在这篇博士论文中,利用LMI技巧
代数曲面的纤维化在曲面分类中扮演了重要的角色。从几何观点看,众所周知,每个半纯函数都能被视作P1上的纤维化(不要求纤维连通)。一个基本问题是,研究P1上的具有连通纤维的纤维化的性质。由[Beal]和[Tan2]的结果,对非平凡的纤维化,奇异纤维的极小个数(即半纯函数的临界点的极小个数)是2。在非常模(相应地,半稳定)的情形,极小个数是3(相应地,5)。我们将P’上具有2或3条奇异纤维的纤维化称为B
本文的主要目的是研究Viehweg和左康得到的Arakelov不等式等号成立的条件,及其曲线模空间(Torelli轨迹)中的Shimura曲线的存在性.Viehweg和左康证明曲面纤维化的Arakelov不等式等号成立,那么底曲线是一条Shimura曲线.设f:X→B是一个定义在一个复数域C上的半稳定的亏格g≥2曲面纤维化,s为f的奇异纤维条数,s1是雅克比非紧的奇异纤维条数,qf是f的相对不规则
本论文致力于从实验上探究光量子信息科学中一种新兴的研究框架,其整合了传统上分隔已久的两种分别基于离散变量与连续变量的路线,将光子探测(光子数)和平衡零拍探测(光场位相及振幅分量)结合在一个实验当中,充分利用了各自在光量子信息处理中的特点和优势。在这种混合架构下,我们首先在实验上制备了两种高纯度的非高斯态,即光子数态和薛定谔猫态,他们分别对应着光量子信息中两种不同的量子比特载体。得益于高探测效率的超
高次谐波是强场激光与原子、分子以及等离子体等物质相互作用过程中一种重要的非线性效应。论文基于不含人为假设的Guo, Aberg, and Crasemann (GAC)的形式散射理论,运用非微扰量子力学第一次完整地研究了高次谐波产生(High Harmonic Generation, HHG),并利用带动力学条件的贝塞尔函数与高次谐波的关系,推导出了一个全新的高次谐波截断公式。鉴于GAC理论早期创
在1990年,Beilinson, Lusztig, MacPherson在[3]中给出了一般线性李代数的量子包络代数的几何实现,这就是著名的BLM实现.后来在[34]中,付强给出了一般线性李代数的小量子群的BLM实现,并且以小量子群为基础提出了小量子Schur代数的概念.研究了小量子Schur代数的标准基,单项式基,以及BLM基,最后给出了小量子Schur代数正(负)部分的的生成元与关系式实现并
曲面嵌入图的着色和曲面上的极小禁用子图问题是拓扑图论的一个重要的研究课题.在许多领域,诸如物理、化学、理论计算机科学等方面,曲面嵌入图的理论都有广泛的应用.Dirac观察到:对每个固定的曲面S和每个固定的自然数k≥8,曲面S上仅有有限多个k-色临界图Mohar和Thomassen证明了:对于Euler亏格7≥3的曲面S,曲面S上的7-色临界图的点数少于69(γ-2).我们借助于Euler公式和Ga
本文研究的是A型量子超群U(glm|n)([84])及其相关的一类重要的有限维商代数即量子Schur超代数SF(m|n,r)([37]).一方面,我们对SF(m|n,r)的不可约模进行了完整的同构分类(推论2.4.3),前提条件是:基域F特征为零,量子参数q是l次本原单位根,l是奇数,m+n≥r.我们利用[25]中的思想,首先把相对范(relative norm)的概念(1.10)应用到SF(m|