面向满文字符识别的训练数据增广方法研究

来源 :大连民族大学学报 | 被引量 : 0次 | 上传用户:breeze001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决采用深度学习方法研究满文识别中训练样本匮乏的问题,提出一种使用数据增广方法扩展训练样本集的技术框架。该框架包括字体几何结构变形与图像质量变换两个模块,采用仿射变换、弹性形变等9种数据生成方法,分别模拟满文字符图像的笔画粗细变化、扭曲变形、光照不均、不同视角及背景等情况下的采集效果。在满文识别的研究中,采用该方法将每个类别的字符数据量扩展到7万个。实验表明,该方法生成的数据在一定程度上弥补了训练样本不足的问题,是解决训练样本匮乏问题的有效技术手段。
其他文献
实验室自动化系统(laboratory automation system,LAS)于20世纪80年代起源于日本。近年来,人们一直在探索适合自己实验室的工作模式,以加快全实验室自动化的进程。我院于2008年
利用CT影像检测肺结节,已成为目前诊断和预防早期肺癌的主要方法。对肺结节的有效识别,是实现肺癌计算机辅助诊断的关键。本文根据医学影像的特点,提出一种基于冗余小波变换和分
传染性非典型性肺炎以其病种新、发病快,传染性强、缺乏特异性药物而倍受全社会关注.其实,在人类与致病微生物长期的斗争中,另一种消耗战往往被忽视--即肺结核.……
会议
目的探讨妊娠高血压综合征(简称妊高征)患者血脂代谢水平的变化及其,临床意义。方法测定正常孕妇及妊高征患者的血清甘油三脂(TG)、总胆固醇(TC)、载脂蛋白AI(ApoAI)、载脂蛋白B(ApoB)、
“现代性”是一个模糊、多义的范畴,在不同的领域有着不同的特征和表现。审美自觉是现代性进程中不可忽视的一个方面,与现代性启蒙思潮的“理性崇拜”不同,审美自觉将“现代
大量医疗设备的引入和提供导致了相应的问题,比如对于一些大的设备的管理维护就是目前比较严峻的问题,我国一些正规的医院都存在对大型医疗设备的保养方面做得不好的问题。通过
抽水蓄能电站输水系统布置复杂,机组工况多且转换频繁,因水泵水轮机不稳定流动导致输水系统振荡甚至产生共振的可能性较大。本研究旨在分析水泵水轮机各种不稳定因素与输水系
以废弃花生壳为碳源,经过灼烧处理,通过超声法一步合成荧光性能优良的碳点,以碳点为探针实现了对三聚氰胺的检测.在缓冲体系下,三聚氰胺能够引起碳点溶液荧光猝灭,根据三聚氰
近年来,随着辅助生育技术研究迅猛发展,胚胎种植前遗传学诊断技术和胚胎干细胞研究将更加成熟,并使生产移植器官、治疗顽固性疾病成为可能,同时,也时生命伦理观念形成冲击并挑战现
一、艺术与客体世界解读“美即是真,真即是美”,首先看到的就是一个传统的文学问题即艺术与客观现实的关系问题。细读《希腊古瓮颂》以及济慈其他的著作及信件,济慈不仅塑造