基于去噪自编码器的改进极限学习机及其应用研究

来源 :吉首大学 | 被引量 : 0次 | 上传用户:jpflxy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
极限学习机(extreme learning machine,ELM)是一类针对前向神经网络设计的机器学习算法,该算法具有训练速度快、泛化性能优、不会陷入局部最小值等优势。目前在疾病诊断、交通标志识别、图像评价等方面获得了广泛应用和良好的效果。然而,由于极限学习机的输入权值和偏置是随机产生的,当样本数据维数较高时,为保证分类性能,极限学习机需要大量的隐含层节点作为支撑,这直接导致了极限学习机网络结构复杂,分类性能不稳定等问题。同时当样本存在噪声干扰时,单隐层ELM不能很好地对样本数据的特征进行表示,从而对数据分类的效果产生严重影响。此外,极限学习机因其优良的特性,已经在识别手写中文字符领域有了很多应用研究,但在识别少数民族字符方面还少有涉猎,特别是在湘西方块苗文上的识别应用还处于空白阶段。本文针对以上问题对传统ELM进行了进一步的研究探讨,主要研究成果如下:1.针对输入数据维数较高时极限学习机需要大量隐含层节点以保证其分类性能的问题,通过对极限学习机的原理进一步分析和推导,提出了双伪逆权值确定的极限学习机(double pseudo-inverse weight determination ELM,DPELM)。DPELM的输出权值先随机确定,其输入权值通过伪逆计算得到,随后再次使用伪逆法确定输出权值,使得输入权值和输出权值都为用解析式计算得到的最优权值,最后采用生长法确定网络的隐含层神经元个数。在与传统极限学习机的性能对比实验中发现:(1)改进后算法的准确率得到了提升;(2)改进后算法达到最佳分类准确率时,所需隐含层神经元个数得到了减少;(3)改进后算法的稳定性更优。将改进后的算法应用于乳腺肿瘤分类识别中,其诊断准确率、假阴性率、耗时较改进鱼群算法优化的ELM、AFSA—ELM、ELM及LVQ、BP等现有算法都有明显的性能提升。实验结果表明,DPELM应用于乳腺肿瘤辅助诊断中具有诊断速度快、分类准确率高、假阴性率低的优点。2.针对数据含有噪声或离群点时极限学习机对数据特征表示能力弱分类准确率低的问题,通过引入去噪自编码器(denoising autoencoder,DAE)算法,将其能够提取数据更为本质特征的能力与改进的极限学习机相融合,提出了基于去噪自编码器的双伪逆极限学习机(DAE-DPELM)算法。使用DAE对输入数据进行特征提取,然后将提取到的特征作为DPELM的输入数据,进行网络训练。在含噪和不含噪声的Fashion MNIST,MNIST,Rectangles和Convex数据集中进行对比性实验,结果表明,DAE-DPELM算法的综合性能最优,用于分类的网络隐含层节点数最少。3.将改进算法应用于湘西手写方块苗文的识别上,并通过与传统的ELM算法和DAE-ELM算法进行对比实验,通过对实验结果的多方面细致分析发现:本文所提出的算法,对湘西手写方块苗文的识别正确率比ELM和DAE-ELM算法有显著的提升,同时也填补了极限学习机在这一应用领域的空白。综上所述,本文所提DPELM算法在不引入其他超参数的情况下,明显的提升了ELM的分类准确率以及结果的稳定性,同时还精简了算法模型的网络结构。而所提的DAE-DPELM算法在抗噪性能和特征提取能力上也比现有的DAE-ELM算法有明显的提升,并在识别湘西手写方块苗文上取得了较好效果,进一步证明了本文改进算法的有效性和优越性。
其他文献
双金属纳米团簇由于其优异的稳定性、选择性,以及磁学和催化性能而受到广泛关注,通过改变纳米粒子的形貌、表面原子分布和粒径大小而具有可调谐性。但是对纳米粒子的热力学性能和结构特性的研究还有待进一步深入,因此以几种金属纳米团簇为研究对象,运用嵌入原子模型对其结构演变、熔化特性、烧结、扩散、生长和结构特征进行原子模拟,从原子尺度系统研究了纳米团簇的结构稳定性、生长规律、结构相变、表面预熔和熔化特性等。首先
背景:跟骨是最重要的承重骨之一,对人体维持平衡、运动具有重要作用。累及跟距关节的跟骨骨折治疗不当可严重影响下肢功能,对于Sanders Ⅱ、Ⅲ型跟骨骨折,跟骨外侧L切口切开复位术被认为是“金标准术式”。此手术方式具有良好的手术视野,且方便植入可靠内固定,但该手术方式可伴随严重软组织并发症,影响治疗效果。C臂引导下闭合复位空心拉力螺钉固定术作为一种治疗跟骨骨折的微创手术方式,能用于治疗Sanders
目的:该研究通过LPS/ATP诱导BV2小胶质细胞炎症模型,探讨DichotomideⅫ在小胶质细胞炎症反应中的作用及机制。方法:实验分为DichotomideⅫ(1.25、2.5、5μmol/L)组、LPS+ATP组(1μg/mL LPS+5 mmol/L ATP)、空白对照组。采用ELISA法检测各组细胞中炎症因子IL-1β、TNF-α的含量;Hoechst 33342/PI染色,荧光显微镜观
相较于有机体系的锂离子电池,以水溶液为电解液的水系锌离子电池(AZIBs)具有成本低、安全性能高、组装简单等优点,在大型移动储能设备中具有广泛的应用前景。目前AZIBs可供选择的正极材料种类较少,其中,最具应用前景的锰基正极材料具有能量密度高、资源丰富、价格低廉等优势。但锰基正极材料在充放电过程中存在循环稳定性差、材料导电性不佳、易发生副反应等系列问题,限制了其在AZIBs中的应用。本文采用不同的
目的:通过对高血压脑出血患者及健康人群肠道菌群进行对比,初步探究肠道菌群与高血压脑出血的相关性;方法:收集2018年9月—2019年2月期间就诊于湘西土家族苗族自治州人民医院神经外科的10例HICH患者纳入实验组,同期收集体检中心10例体检健康者作为正常对照组。分别提取两组粪便样本中细菌总DNA,通过Illumina Hi Seq测序平台进行宏基因组测序,利用Bowtie2、meta SPAdes
目的:通过对剖宫产瘢痕部位妊娠患者采取的不同治疗方法进行统计分析,进而了解不同治疗方法的有效性及优缺点,以期为CSP患者选择合理临床治疗提供正确指导。方法:收集2018年1月-2020年10月湘西自治州人民医院收治的剖宫产瘢痕部位妊娠的132例患者电子及纸质病历资料、随访信息进行回顾性分析。查阅的病例资料包括:一般信息:年龄、治疗前血β-HCG值、停经时间、距前次剖宫产时间、产次、宫腔操作史次数、
近年来,分数阶微积分理论在众多领域应用广泛,而解的存在性是研究解的稳定性、渐进性的基础,因此对分数阶微分方程边值问题解的存在性和唯一性进行研究具有重要意义.本文主要利用不动点定理,拓扑度理论和压缩映射原理研究了五类分数阶微分方程边值问题解的存在性和唯一性,全文共分为四章,具体包括:第一章,从p-Laplacian算子、脉冲微分方程、Hadamard型分数阶微分方程和耦合系统四个方面介绍了本文的研究
二十世纪物理学最大的创举就是量子力学的创立,近代物理学由量子力学和相对论作为其理论基础而建立。至今,在量子信息领域相关研究中,其之所以取得巨大的进展在于它采用了量子力学作为其基本原理。大量的理论研究在已有的实验条件下获得了相应的验证。粒子与光场间相互作用的研究一直备受关注,本文采用相干态正交化展开方法,对三量子比特的纠缠度影响因素进行分析研究,并运用数值计算结合解析解对三量子比特在光场初态为真空态
研究目的:通过回顾性分析对比疤痕子宫足月妊娠经阴道试产与初产妇足月妊娠经阴道试产的差异性、影响疤痕子宫阴道试产成功分娩的因素及其阴道试产失败中转剖宫产原因,为疤痕子宫足月妊娠经阴道分娩的安全性、可行性提供临床依据,并降低剖宫产率。研究方法:收集怀化市第一人民医院2018年6月-2019年6月足月妊娠经阴道试产患者病例,按纳入及排除标准进行筛选病例共520例,其中120例为疤痕子宫经阴道试产组(A组
目的:探讨非小细胞肺癌(non-small cell lung,NSCLC)组织中核仁磷酸蛋白(Nucleophosmin,NPM)和增殖细胞核抗原(proliferating cell nuclear antigen,PCNA)表达的意义。我们还进一步评估非小细胞肺癌中NPM和PCNA蛋白表达与患者临床病理特征的关系,旨在确定两者在该恶性肿瘤中的临床病理意义。材料与方法:纳入吉首大学附属第四医院