基于贝叶斯深度学习的高维小样本数据分类研究

来源 :华北电力大学(保定)   | 被引量 : 0次 | 上传用户:jaredchen123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的快速发展,基于大量样本的数据分类取得了重要进展,在很多数据集上,已经超越了人类的识别水平。但是,现实中很多问题的样本数量是极为稀少或者场景难以复现,用于训练的数据非常稀少,传统的深度学习方式在这种情况下效果并不理想。而贝叶斯学习可以利用参数的先验分布和少量样本来估计后验分布,实现小样本条件下机器学习。本文主要基于贝叶斯学习与深度学习结合的贝叶斯变分自编码器网络,从数据增强和神经网络搭建两个方向出发,研究小样本下图像分类方法,主要工作包括如下几个方面:
  研究了现有的基础数据增强方法和数据生成方法,对贝叶斯变分自编码器和生成对抗网络进行改进,给出一个用于小样本数据生成的贝叶斯变分生成对抗网络模型。生成器采用贝叶斯变分自编码器,其特征提取的隐层采样过程可以有效避免因样本数据少带的来过拟合问题,且重构损失函数约束重构图片和输入图片一致,解决了生成对抗网络的模式崩溃问题。通过不同的数据生成方法在相同的分类网络上测试,本文生成的数据可以用于训练分类网络,且与其他数据增强方法相比在应用到数据分类的场景中具有更好性能。
  研究了现有的度量网络、迁移学习适用于小样本数据分类的方法,结合贝叶斯变分自编码器对孪生网络进行改进,搭建了一个用于小样本数据分类的贝叶斯孪生变分自编码器神经网络,首先对训练样本数据使用预训练的贝叶斯变分自编码器进行降维处理,提取样本的隐含特征,然后将两个样本成对输入孪生网络进行相似度匹配,返回与待测样本标签为同类的样本类别以及正确率,完成小样本数据的分类。在标准数据集上与其他分类方法对比,本文给出的贝叶斯孪生变分自编码器具有更好的分类准确率,并且拥有较高的均值和较低的标准差,分类性能更加稳定。
  将本文给出的数据增强方法和小样分类方法应用于变压器局部放电模式识别中,实验证明,本文的方法较对比的分类方法识别正确率更高,通过实际场景复杂问题的应用证明了本文小样本数据分类方法的拓展能力。
其他文献
在智能电网中,智能电表实时采集用户的细粒度用电信息并周期性发送到控制中心,控制中心利用采集到的用电信息进行发电预测、实时定价及需求响应。由于用户的细粒度用电信息包含个人隐私,如若发生用电数据泄露将会影响用户的使用,从而制约智能电网的发展。因此,信息安全是智能电网稳定运行及发展的前提。本文围绕认证、数据完整性、机密性及保护用户数据隐私等确保智能电网安全稳定运行的要求设计了如下方案。首先,提出了一种高
学位
随着互联网产业的快速发展,社交网络自媒体时代的到来,微博作为一种以信息发布、互动交流为主的广播式社交网络平台,消息传播速度快范围广。对海量的微博文本的进行情感分析,挖掘用户对商品、新闻、能有效的了解用户的喜好,监控社会舆论走向,具有重要的意义。情感分析是自然语言处理领域的一项重要任务,已经成为当今热点研究方向。深度学习不同于传统的设计网络,基本不需要人工辅助,通过学习数据的浅层属性和特征,总结规律
学位
近年来,智能交通领域在人工智能领域的推动下不断发展,车辆跟踪技术作为智能交通领域研究的基础问题越来越受到人们的关注。深度学习作为解决目标跟踪领域问题的主流方法,基于深度学习的车辆跟踪算法成为了智能交通领域研究的热点,如基于卷积神经网络(CNN)的目标跟踪模型,虽然该类模型在跟踪的准确性上取得了突破性的进展,但是在跟踪速度上很难做到实时跟踪。于是,基于完全卷积孪生神经网络(SiamFC)的目标跟踪方
随着科技的发展,智慧大棚、智慧温室和植物工厂等的出现,改变了传统农业种植方式。近年来温室大棚种植规模越来越大,这种种植方式使植物生长环境得以人为控制,充分发挥土地产能,提高产量。植物光照控制系统结合计算机网络技术对植物的生长环境进行调控,具有理论研究和实用价值。  针对温室内植物种植的光环境调控,本文采用新型光源LED作为补光光源,以无线网络通信方式,采用简单的星型拓扑结构,将各个终端节点与Zig
学位
图像领域中对于图像的清晰度和分辨率要求越来越高,研究模糊图像修复和图像超分辨率重建的问题,不仅有利于提升图像的视觉质量,更是能够提升视觉应用的鲁棒性,具有重要的实际应用价值。本文在研究生成对抗网络的基础上,尝试对生成对抗网络进行改进并应用于图像处理,以解决图像模糊和分辨率较低的问题。具体做了如下研究:  (1)分析和研究生成式对抗网络的基本模型和图像处理的相关内容,利用生成对抗网络处理图像已经成为
学位
变压器局部放电是造成变压器绝缘故障的主要原因。对不同类型的局部放电进行有效识别有利于故障的定位和排除。局部放电相位分布分析(PRPD)是目前应用范围最广、效果较好的局部放电模式识别方法,该方法基于PRPD图谱进行特征提取与放电类型分类,但常用的特征提取方法均基于原始检测数据,由于不同检测设备所用数据格式不同,且不同企业对数据相互保密,造成了局放诊断方法的不通用性。  PRPD图谱具有相关国际标准,
学位
随着智能电网的发展,针对电力设备故障的智能化检测成为研究热点。各种智能化监测设备与日俱增,电力设备一旦发生故障,将会产生大量故障数据,尤其极端天气下,更会产生井喷式数据,传统的单机处理环境已经无法应对。为解决此问题,本论文将传统故障诊断方法与Spark、MapReduce大数据框架相结合,以变压器故障诊断为例,对大数据环境下的电力设备诊断方式展开研究。  设计了深度信念网络在Spark框架上的并行
无人机航拍应用于很多领域,如交通监测、监控巡查、电力巡检、农业植保等。无人机航拍的图像处理却面临着拍摄图像分辨率高、背景复杂、易受光照、风速等天气影响而导致图像噪声过大以及对实时性要求过高等诸多问题。经典算法如Harris、SIFT(Scale-invariant feature transform)、FAST等均不能较为理想的满足实时性和准确性的要求,因此需要对无人机领域的图像预处理及图像匹配算
学位
电力改革使得新的售电主体进入电力市场,售电公司逐渐成为发电厂与用户之间沟通的桥梁,成为了电能消耗的一个重要环节。随着电力市场改革的不断加快,售电公司若想获得更多的潜在用户并增强客户粘性,使公司稳定长期的发展,通过大数据相关技术对用户用电海量数据进行挖掘以实现针对不同用户的个性化套餐则是必然的选择。  本文在售电侧改革的背景下,重点运用了数据挖掘技术中的聚类算法,对居民用户用电模式进行了细分,最后实
电动汽车接入电网就是通过电动汽车与电网之间双向的的信息流和电力流的互换,采用先进的信息、通信技术将孤立的电动汽车和电网连接起来,使电动汽车参与到需求侧管理中,起到“削峰填谷”的作用。而在电动汽车接入电网的过程中,电动汽车用户会与电网进行双向的信息流交换,而这些信息一般会包含电动汽车用户的位置隐私、身份隐私以及电价信息、规划的充电路径等,而这些信息一旦被非法分子攻击就可能会造成用户信息被追踪、泄露或
学位
V2G