手写字符和图像识别的神经网络激活函数研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：dingxiaoyun

【摘要】

：

字符识别和图像分类是人工智能的一个重要研究方向。通过训练一组给定的输入字符图像和分类标签集合,来实现预测其他输入图像的分类标签的目的。神经网络能够自主提取图像特

【作者】

：

阮文长（NGUYEN VAN TRUONG）

【出处】

：

西安电子科技大学

【发表日期】

：

2020年01期

【关键词】

：

神经网络手写字符识别越南字符图像分类激活函数硬件实现概率自适应

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

字符识别和图像分类是人工智能的一个重要研究方向。通过训练一组给定的输入字符图像和分类标签集合,来实现预测其他输入图像的分类标签的目的。神经网络能够自主提取图像特征,并在字符识别、图像分类、语音识别、视频目标跟踪等各个领域处理任务中具备抽象的能力。神经网络具有出色的性能,但随着“大数据”时代的发展,数据量每日不断增加,信息内容更加复杂,神经网络性能迎来了新的挑战。另外,随着硬件性能的提升,FPGA成为实现神经网络的有效平台。但是由于网络的结构日趋复杂,硬件的资源消耗也在相应增加。本文针对手写字符识别、越南文字符识别和图像分类实际应用,围绕神经网络结构和激活函数算法做了深入的研究,为未来神经网络的推进提供了借鉴和技术支持。本文的主要研究内容包括:在分析卷积神经网络结构特点的基础上,与单向连接方法相比,本文提出了一种CNN＿GRU混合神经网络模型解决了神经网络全连接层的同一个网络层的神经元之间没有互相连接关系的问题。该模型采用卷积神经网络的卷积层和池化层实现图像特征提取,然后使用门控制循环单元代替卷积神经网络的全连接层,使得神经元之间具有时序连接关系,最后对于网络模型产生的过拟合现象,采用dropout技术进行优化。实验结果表明,所提出的CNN＿GRU网络结构在MNIST手写数字上获得的准确率达到99.21%,与Lenet-5模型相比提高了0.16%,同时训练和测试的运行时间降低到57.91秒和3.54秒。提出了一种基于概率的Sigmoid激活函数分段拟合方法保证在降低硬件资源的同时提高网络的识别准确率。硬件实现神经网络算法时,通常需要对Sigmoid激活函数进行拟合,从而简化算法的复杂度,但现有的方法随着复杂度的下降,网络的性能也下降。为了解决上述问题,本文提出了一种基于神经网络神经元值的分布概率的Sigmoid分段线性拟合方法。该方法首先将Sigmoid函数划分为三个固定区域,然后根据每一层神经元值在这三个区域内的分布概率提出三种分段的处理方式,最后使用2^-n为斜率系数的线性函数对Sigmoid进行拟合,提出三种不同的拟合行为应用于不同网络层。实验结果表明,所提出的Sigmoid激活函数的拟合方法在仅采用加法电路的情况下,在MNIST手写数字、VNCD越南字符和CIFAR-10图像数据集上分别能获得98.42%、68.29%和63.14%的识别准确率,比起其他方法最高可提高了0.57%、2.38%和1.99%。基于Re LU激活函数以及其现有改进方式的研究,提出了一种Re LU激活函数的改进方法SWish LU,以避免Re LU函数引起的神经元坏死的问题。该函数在负半轴部分使用Swish函数实现激活,使得函数同时具有Swish和Re LU两个函数的优点。这个函数不仅避免了神经元死亡的现象,而且合理地利用网络负输入信息,从而提高网络性能。实验结果表明,Swish LU激活函数使得网络在MNIST、VNCD和CIFAR-10数据集上获得的准确率分别为99.18%、82.82%和63.81%,与Re LU函数相比分别提高了0.09%、2.08%和0.74%。针对激活函数输出均值非等于零导致输出偏移问题,本文提出一种自适应反比例线性激活（Adaptive Inversed Proportional Linear Activation,AIPLA）函数。该函数采用分段激活方法,每一段根据分段点以及斜率系数的变化,得出不同的激活方式包括线性激活和反比例激活,结合了原点对称、上下有界、非单调和计算简单等优点,并且斜率系数可以通过训练过程学习自我进行更新,提高激活函数的灵活性。实验结果表明,所提出的激活函数能使得网络在MNIST、VNCD和CIFAR-10数据集上获得的最高准确率分别为99.32%、88.79%和65.59%,与现有激活函数相比分别提高了0.17%、6.35%和0.82%。同时,在同一个训练准确率的要求下,该函数需要的训练次数分别减少了4倍、4.5倍和1.41倍。

其他文献

静电成像数字印刷技术及其印刷机（连载三）

（接上期）3）离子成像及其数字印刷机①、离子成像静电摄影成像是通过激光曝光，重新分布印版滚筒表面光导体的巨量电荷。而离子成像是离子在图像载体（电介质涂层）上直接生成电荷图像

期刊

静电成像数字印刷离子成像磁记录成像

论党的先进性再造——社会建党论系列研究之二

党的先进性的再造分四个问题进行探讨：一是党的先进性的构成；二是党的先进性建设的基本方式；三是党的先进性建设的根本之点；四是党的先进性建设深化和完善的主攻方向．

期刊

马克思主义建党路线思想建党路线政治建党路线社会建党路线先进性Marxism party-building route Thought party-bu

基于光纤光谱技术的羊肉掺假检测

Lamb meat is delicious and rich in nutritional value.It is deeply loved by consumers and its demand at home and abroad continues to grow.However,because many mutton processing companies are difficult

学位

光照在蛋鸡养殖中的合理应用

蛋鸡作为家禽养殖的主要群体之一,其产蛋率对于养殖效益影响显著,但蛋鸡对相应的光照周期、时间及对应的光源性质、强度都会存在一定的敏感性及反应性。在蛋鸡养殖中,适宜的

期刊

光照蛋鸡养殖合理应用

岩石应力-应变过程中渗透率变化分析

岩石空隙率与空隙的几何性质是影响其渗透率的关键因素。通过分析渗透率-应变曲线与岩石破坏过程的对应关系,指出岩石的渗透率与岩石的体应变密切相关。在压密区间内,岩石的

期刊

岩石力学渗透性本构模型渗透率-应力关系rock mechanics permeability constitutive model permeabili

卡托普利加消心痛治疗肺心病急性加重期86例临床观察

８６例肺心病急性加重期采用卡托普利和消心痛治疗，总有效率达８１．３９％，显著优于对照组（Ｐ〈０．０１），并对其机理进行探讨。

期刊

肺心病卡托普利消心痛药物疗法

论虚拟法律关系的客体

人类给自己又创造了一个生存空间——虚拟空间。人们之间的交往和互动也就不可避免地进入到虚拟空间中，形成了虚拟社会。从而也就把利益纷争带到了虚拟社会，法律也只好随之介入

期刊

虚拟法律关系虚拟法律关系客体虚拟财产虚拟行为fictitious law relationship the object of the fictitio

吕祖谦与《近思录》

朱熹与吕祖谦合编《近思录》，本来是一个不争的事实。由于朱熹的影响和学术地位，时有抹煞吕氏名字现象的情况发生。虽有像《四库全书总目》这种权威著作力陈其非，仍未肃清影响。

期刊

吕祖谦朱熹近思录Lv Zuqian Zhu Xi Jin Si Lu

手写字符和图像识别的神经网络激活函数研究

其他学术论文