基于限制玻尔兹曼机的深度学习模型改进及应用

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:huoxingtan22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习在计算机视觉、语音理解、智能控制、生物医学、智能医疗诊断、智能驾驶等领域取得了突破性进展,正日益引起学者广泛关注。基于限制玻尔兹曼机的深度学习模型因其模型表达能力强、适合多种类型任务正成为研究热点。目前基于限制玻尔兹曼机的深度学习模型主要有深层置信网络、深层玻尔兹曼机两种模型。虽然二者互有优势,但是二者均存在提取低质量特征、特征选择性差、鲁棒性差的问题。其根源在于构建它们的子模块不具备高阶特征提取、特征选择、鲁棒性特征提取的能力,为此本课题对此展开深入的研究。同时,近年来智能医疗诊断兴起,阿茨海默症早期诊断已经成为迫切需求,虽然基于限制玻尔兹曼机的深度学习模型在医疗诊断中已经表现出巨大潜力,但在阿茨海默症早期诊断上仍然很大提升空间。因此研究表达能力更强的基于限制玻尔兹曼机的深度学习模型具有重要的理论意义和应用价值。
  针对上述问题,本文重点解决基于限制玻尔兹曼机的深度学习模型在分析不同数据类型时的特征质量不高、特征选择性不强、鲁棒性特征不足的问题,同时尝试采用改进的模型去解决医疗诊断问题。论文的主要内容包括以下三个方面。
  (1)针对深层置信网络在分析低分辨率且具有复杂背景或者噪声的图像时无法选择有用的原始特征以及无法提取高阶特征的问题,提出了一种基于改进的高阶玻尔兹曼机EHBM及其深层模型DBN-EHBM。改进模型通过使用逐点门控机制,将有用模式和无用模式分开,然后利用双隐藏层变量机制提取有用模式高阶特征。同时利用高阶特征进一步改善特征选择,提高逐点门控机制运行准确率,更好分离有用模式和无用模式。最后为了解决监督和半监督问题,进一步扩展EHBM,分别提出SEHBM和Semi-SEHBM。仿真结果表明,EHBM、DBN-EHBM以及其扩展模型在多个数据集上较好地实现特征选择和高阶特征提取。
  (2)针对深层卷积置信网络在分析高分辨率且具有噪声的图像时无法提取高阶特征以及特征鲁棒性不足的问题,提出了一种收缩脉冲实值卷积玻尔兹曼机CssCRBM及其深层模型收缩脉冲实值深层卷积置信网络CssCDBN。改进模型通过双变量机制提取高阶特征,引入双变量最大池化技术提取高阶不变特征,然后利用收缩惩罚项提高特征的鲁棒性。实验结果表明CssCRBM及CssCDBN提取到了鲁棒性好的高阶特征。
  (3)针对阿尔茨海默病早期诊断的问题,考虑到深层玻尔兹曼机在处理脑电频谱模糊数据集上的优势,提出了基于多任务框架下的判别式收缩脉冲实值深层卷积玻尔兹曼机DCssCDBM用于阿尔茨海默病早期诊断。首先提出DCssCDBM用来同时完成高阶特征提取和分类,使得提取特征更加具有判别性。同时为了避免模型陷入过拟合,引入身份认证和身份识别作为辅助任务,从而提高模型的识别性能。实验结果表明,所提算法取得了较好的诊断率。
其他文献
神经网络在机器学习和认知科学领域是一种模仿生物神经网络的结构和功能的数学或计算模型,用于对函数进行估计或近似。至今已有若干种深度神经网络,如卷积神经网络(CNN)、循环神经网络(RNN),应用在计算机视觉、自然语言处理、语音识别与生物信息学等领域并获取了很好的效果,特别是卷积神经网络可以在目标识别、检测和场景理解等任务上达到前所未有的精度。从2012年提出的AlexNet(8层网络)到2015年提
基于AlGaN材料制备的深紫外发光二极管(DUV-LED)具有高能效、无污染等特点成为传统汞灯的理想替代者之一。本论文采用金属有机化合物化学气相沉积(MOCVD)技术在半极性r面蓝宝石衬底上外延生长了高质量非极性a面AlGaN材料,并成功制备出发光波长为280nm的非极性AlGaN基多量子阱(MQWs),为制备高光效的非极性AlGaN基DUV-LED奠定了坚实的基础。本论文的主要研究内容如下:  
近年来,随着可见光技术的兴起,对可见光的应用和开发随之而来。传统的室内定位技术研究包括ZigBee技术、WiFi、蓝牙、超宽带技术等都集中在射频信号,辐射强并且保密性差。本文在可见光通信(Visible Light Communication,VLC)发展的契机上,将可见光通信技术应用于室内,为室内定位技术提供了一种新的解决方案。  针对传统室内定位的不足,本文创新性的结合室内的具体环境特点与可见
随着现代通信和多媒体技术的迅猛发展,网络上数字图像的数量出现了急剧增长,如何从海量的数字图像中快速而有效地找到人们所需要的图像,是一个非常有理论价值和实际意义的研究课题。为缩小图像底层特征与高层语义之间的语义鸿沟,如何将图像底层特征与图像的语义视觉关键词相结合进行图像自动标注,以及如何利用学习的图像标签进行高效的图像检索,成为新的研究热点。本文研究属性的学习以及基于属性的图像检索方法,围绕着三个问
学位
人体动作识别是计算机视觉领域中的一个研究热点,在智能监控、视频检索、人机交互、游戏等领域有着广泛的应用。深度相机的出现提供了视频的深度信息,解决了传统的基于RGB视频的人体动作识别方法受光照、背景等因素的影响较大的问题,同时也为如何处理这些信息带来了挑战。如何提取视频中的有效特征,一直是动作识别中的难点之一。近年来,研究人员在相关领域取得了巨大的进展,特别是基于动态图的人体动作识别方法取得了良好的
随着陆地资源的逐渐减少,海洋资源开发利用和海洋环境保护已经越来越令人关注,水下探测技术成为其中重要的支撑技术和研究领域。相比之下,水下光学图像因具有快速成像、高分辨率、丰富的纹理和细节信息以及颜色信息而成为水下近距离探测最为有效的手段。然而,水下环境与陆地环境的差异造成水下光学图像在成像过程中极易受到如下因素的影响:一是成像过程中电子元器件以及光子的不规则运动引起的随机噪声;二是水体对照射光线的吸
与有线通信系统相比,无线通信系统的传输环境比较复杂,导致其性能会受到无线传输信道的影响。特别值得注意的是无线通信信道的传输延迟引起的多径效应,导致严重的码间干扰,影响通信质量。为提高无线通信质量,降低系统误码率,消除多径效应造成的码间干扰,需要对无线通信信道进行有效估计,即信道估计。另外,由于多径效应的缘故,无线通信信道中的冲击响应通常表现出稀疏性。因此,本文旨在利用无线通信信道固有稀疏特性,针对
学位
多项式相位信号(Polynomial Phase Signal,PPS)是有限时间间隔内连续瞬时相位信号的最佳表示模型,广泛应用于雷达、声呐等领域。PPS参数估计在雷达领域中的目标识别、成像、运动参数获取以及声呐领域中的目标探测等应用中发挥着重要作用,是一个具有重要应用价值和理论研究意义的课题。本文针对现有PPS参数估计算法中存在的计算复杂度较高、抗噪性能较差以及伪峰问题进行研究,并提出了相应的解
跳频(Frequency Hopping,FH)作为扩频通信的主要技术手段之一,具有抗干扰能力强、截获概率低等优势,因此跳频技术在现代军事通信中被广泛应用。跳频技术的反侦察和抗干扰的特性给军事通信侦察任务提出了严峻挑战,跳频信号的侦察主要包括两个关键任务,即跳频信号参数估计与分选。近年来跳频信号的参数估计、跳频网台分选等侦察处理技术是通信对抗领域的研究热点。本文根据现阶段跳频信号侦察技术中存在的问
学位
电磁矢量传感器是由若干个极化特征不同的极化天线组成。由电磁矢量传感器构成的极化敏感阵列,不仅可以接收电磁波的幅度、相位和波形等信息,还可以接收电磁波的极化信息。完备的电磁矢量传感器可以接收时域、空域和六维的极化域信息,和传统的标量阵列相比,极化敏感阵列拥有更好的抗干扰能力和更高的分辨力。残缺的电磁矢量传感器仅包含完备的电磁矢量传感器的部分子天线,使其在保持极化敏感阵列优点的同时,具有更少的接收数据