基于深度学习的手写汉字字体风格迁移

来源 :景德镇陶瓷大学 | 被引量 : 0次 | 上传用户:wudizeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字的风格迁移是一项复杂、具有挑战性的研究问题。与英语不同的是,汉字在结构、笔画、风格都较为复杂。监督学习的生成对抗网络需要大量的对称数据,这对于很多的手写汉字字体收集和整理来说是非常困难的。另外,无监督学习的生成对抗网络生成的汉字字体会出现较多的笔画错误,甚至无法辨认。而且在以往的研究中,风格迁移生成对抗网络只注重生成的汉字字体风格,而忽视了生成汉字字体的分辨率。为此本文提出SR-Cycle GAN,来改善生成字体的完整性、提高生成字体图像的分辨率。无监督生成对抗网络使用非匹配数据进行训练,能节省大量的汉字字体图像收集与整理工作。但是无监督学习的生成对抗网络进行风格迁移时,生成出笔画缺失、错误、模糊等问题字体。归一化操作能加快网络的训练速度和网络训练的稳定性,但是批归一化操作会丢失较多的图像细节信息。对此,减少或者更改批归一化层的使用,能让生成网络学习到更多的风格细节信息。本文引入TV loss来约束噪声和降低两个像素之间的差距,通过降低TV loss使生成网络能生成笔画较为完整的手写汉字字体。由于原始的Cycle GAN并不能生成较高分辨率的图像。因此,本文对原始Cycle GAN网络进行改进,在解码网络中通过增加上采样的层数进而使得生成网络能生成像素更高的图像。原始Cycle GAN使用转置卷积来进行上采样,转置卷积在超分率重建中表现的并不好,对此,将转置卷积改为亚像素卷积进行上采样。这时,正向映射生成的汉字字体图像像素比原来大n倍,反向映射生成的汉字字体图像像素也是大n倍。根据算法的循环一致性原理,经过一个循环后,原始字体像素将被放大为n的平方倍,从而达到超分辨率的效果。本文用HWDB1.1中的240个训练集训练Tensorflow与中文手写汉字识别模型,60个测试数据集测试模型,得到Top-1 84.6%和Top-3 93%的识别准确率。用兰亭字体和HW-1252作为风格字体,楷体和黑体作为转换字体,训练SR-Cycle GAN,得到生成的风格字体和超分辨率重建字体。分别在3755个生成和重建的手写汉字字体中随机选取部分样本,尽量保证选取的样本中既要有结构简单的字体,又要有结构复杂的字体。选取的样本输入到训练好的中文手写汉字识别算法中,原始Cycle GAN平均识别率为33.4%,SR-Cycle GAN平均识别率为92%。生成和重建的兰亭字体也有较好的表现,重建的兰亭字体Vollath增加了455144262,brenner增加了25153766,SMD增加了413252,variance增加了482932680。重建后的手写汉字图像Vollath增加了67953839,brenner增加了1178850,SMD增加了137866,variance增加了76186361。可以得出,SR-Cycle GAN在手写汉字字体风格迁移和超分辨率重建上有较好的表现。
其他文献
信用等级低、融资困难已经成为制约着我国中小企业发展的难题,也致使中小企业无力执行最优订购决策,供应链无法取得最大的利润。供应链金融的出现开始缓解了中小企业的融资困
本文主要研究把描述电子偶素(e-e+束缚态)的Bethe-Salpeter(BS)方程约化到Schr?dinger方程,得到Schr?dinger方程势能的相对论修正。其中BS方程是基于量子场理论,用于描述二粒子束缚态的方程。它满足相对论性要求,是协变的。Schr?dinger方程基于量子力学,不满足协变性要求。约化BS方程到Schr?dinger方程,必然要做一些近似,这些近似会破坏BS方程的协
默契,准确来说,是一种下属主动培养并与上司形成的关系,一般称之为下属默契。它是一种下属对上司工作相关的期望、意图和要求,不经言传而暗相投合的状态。反映了在双方之间,
图像超分辨率增强技术在医疗影像、视频监控、航空、多媒体以及日常生活等领域有着较为广泛的应用。随着深度学习网络的发展以及计算机运算能力的不断提升,图像超分辨率增强
随着人们物质生活水平的不断提高,食品安全问题的层出不穷,消化道疾病成为威胁人们生活质量的重要疾病之一,其中结肠肿瘤尤为严重。当前,在对于结肠进行检查的时候,选择的最
气候变化已经对人类的可持续发展构成了严重威胁,过去高消耗、高排放的经济发展模式难以为继。企业积极部署碳减排工作不仅是推动我国经济转型升级的必经之路,也是为促进人类
降低能耗与解决加工任务分配不合理是我国机械制造业实现可持续发展的重要措施之一。对面向能耗的柔性作业车间调度模型创新与数据监测系统研制进行了相关研究,为机械制造企
随着经济全球化时代的到来,金融业面临着巨大的机遇和挑战,银行作为金融业的核心,其发展也是金融行业发展的重点、对于银行市场来说,进行科学合理的业绩考核,是促进企业良性
互联网信息海量化,信息质量鱼龙混杂,在这样的背景下,搜索引擎为用户上网提供导航,发展至今,网民已离不开网络搜索。本论文因此选题“搜索引擎用户使用情况与环境认知及行为
权责关系是科层组织运作的基础。然而,权责失衡是基层行政体系的实践常态。权责失衡是压力型体制的制度性产物,具体表现为治理事务泛化、治理权力上移、治理责任下移的权责配置状况。权责失衡本质上是条块关系问题,无论是属地管理体制,还是垂直管理体制,条块关系始终制约着权责配置结构。在属地管理体制下,条块之间的权责关系呈现出“科层化”和“去科层化”的双重互动困境。在垂直管理体制下,以块块为基础的分权系统逐渐被以条条为基础的集权系统所取代,带来条块之间的权责失衡。囿于权责失衡,基层管理体制的组织调适体现为非正式政