偏最小二乘判别法研究及应用

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:zmc02302
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
偏最小二乘法判别法是被广泛应用的一种高维数据降维分类预测判别方法,但在实际中,该方法通常会产生难以解释的原始变量的线性组合。在本文中把判别纳入到回归的框架之中。提出了一种带有惩罚项的稀疏型偏最小二乘法,结合矩阵的奇异值分解提出了一种秩为一矩阵的近似方法和算法。提出该种方法的目的在于把高维数据的变量筛选和变量的线性组合同时合并到一个步骤之中。尽最大可能地找出原始特征中包含的有用信息,实现数据的降维。我们模拟生成了高维度二元分类判别数据和多元分类判别数据,并应用到已经公开的食管鳞癌数据,与普通的偏最小二乘法做了比较。结果表明,我们所提出的方法在变量选择方面表现优异,而且在具有更好的敏感度和更好的特异度。在高维的二元分类和多元类别分类中,提供了很高预测精度和稳定性,并且具有更高计算效率。
其他文献
吡唑和异噁唑属于1,2-唑类杂环化合物,是很多药物分子、农药分子和有机功能材料的重要结构,其合成方法的研究对其生产应用至关重要。目前此类杂环分子主要通过1,3-二羰基化合物和肼或羟胺反应、偶极环加成反应以及通过肟和腙环合等进行合成。随着环境因素在精细化工品生产中占比越来越重,开发清洁、快速、高效的有机合成手段是目前有机化学研究的一个迫切方向。本文研究了由含有α活泼氢的芳香酮类化合物合成烯胺酮、由烯
特发性肺纤维化(Idiopathic Pulmonary Fibrosis,IPF)是临床上最常见的间质性肺疾病。IPF病因不明,发病年龄多在60岁以上,是一种典型的衰老相关性疾病,病变局限在肺脏,临床表现为进行性呼吸困难并伴有肺实质的间质性浸润及限制性肺通气障碍。以普通型间质性肺炎(Usual Interstitial Pneumonia,UIP)的病理学特性为特征,即过多的细胞外基质沉积和肺组
造岩元素中子伽马仪器的探测器尺寸较小,导致测量的伽马能谱精度较低,基于常规解谱方法,元素干重计算误差较大。本文提出一种优化的分谱加权最小二乘解谱法。该方法将全谱加权最小二乘法与分谱加权最小二乘法结合起来,利用全谱加权最小二乘法对地层元素进行筛选,根据地层元素组合,采用特定道址的分谱加权最小二乘法进行解谱,其解谱效果明显好于常规解谱方法。此外,本文对基于深度学习的元素测井数据处理方法进行研究。基于混
A2BB’X6型双钙钛矿分子材料由于其结构稳定,性质优异,成本低廉等优点受到了人们的广泛关注,具有无毒、环境稳定性高等特点,同时也成为目前太阳能电池研究领域的热点。为了筛选优质的双钙钛矿分子,本文采用密度泛函理论设计了所有可能存在的全无机无毒的A2BNi X6型双钙钛矿分子。研究了分子的结构稳定性、电子性质和光学性质,分析了不同位置的元素对其能带和光学性质的影响。这些研究为双钙钛矿太阳能电池的吸光
井周地层的横波慢度信息,在评价井壁稳定性、判断泥浆滤液侵入以及选择射孔位置等方面有着重要的作用。偶极横波测井激发频率低、探测深度深,是确定井周地层横波慢度径向分布的有效测井方法。目前主要有两类反演偶极横波径向慢度剖面的方法,一类是结合微扰法和BG理论的反演方法,另一类是基于参数化的高频约束反演方法。这两类方法都是根据井外地层横向慢度的变化对偶极横波频散特征的影响来进行反演的,但是两种方法都未考虑仪
气液搅拌流动主要特征是液膜上下剧烈震荡以及存在液滴夹带等流动情况现象,其流动特点实质上是气液相界面的不同演变特征造成。剪切稀化非牛顿流体搅拌流广泛存在于各个工业领域中,对于系统的安全和稳定运行有着重要的意义,但其相关研究较少。因此,有必要对剪切稀化非牛顿流体气液两相搅拌流的相界面失稳演变特性进行研究。本文基于Kelvin-Helmholtz不稳定性采用机理建模的研究方法,系统研究了剪切稀化非牛顿流
光通过光学器件或溶液时,会产生反射、透射、散射等光学现象,光学性能检测就是指对这些光学现象进行检测从而对待测样品的物理性质和化学性质进行分析。衍射光栅是一种重要的光学器件,其由微米/亚微米级的刻线构成。光栅存在多个衍射级次,各级次的角间距由光栅常数、即每毫米的刻线数决定,各级次的衍射效率分布主要由光栅微观槽型决定。精确测试光栅各级次的衍射角与衍射效率,对于评价光栅性能与制备工艺不可或缺。然而,不同
干涉是光场的波动特征之一,源自干涉原理的一系列光学技术是现代科技的重要组成部分,其中的全息技术是干涉应用的典型代表。普通摄影技术利用光学透镜的物像变换作用,只记录下物光场的强度(振幅)信息,由于相位信息的丢失,因而其失去了对物体进行三维成像的能力。全息技术是基于光波干涉,将物体的振幅和相位信息以干涉条纹图(全息图)形式记录下来,进而通过光学或数字过程重建出物光场的波前、再现出物体的三维图像。全息原
石墨烯具有丰富的物理、化学性质,在透明导电薄膜、半导体等领域极具应用前景。目前,化学气相沉积(CVD)法由于操作简单、价格低廉并且可以大规模制备出高质量的样品,被认为是最可能实现石墨烯未来应用的制备手段。然而,CVD石墨烯总是存在着褶皱,褶皱作为一种线缺陷,将降解石墨烯的性能,影响薄膜的宏观均匀性。因此,如何彻底消除褶皱,实现无褶皱、超平整石墨烯的大规模制备是该领域的一个重点也是难点。此外,CVD
神经形态计算旨在模拟生物大脑和感知神经系统的信息处理方式,构建一个能够自主学习和具备认知功能的超低功耗智能计算机。突触、神经元和感觉接收器是生物计算系统处理信息的基本单元。因此,神经形态计算硬件实现的第一步就是研制出具有突触、神经元或感觉接收器功能的神经形态器件。新型神经形态器件凭借单个器件就能实现复杂的神经形态功能,其中电解质栅晶体管(Electrolyte Gated Transistors,