基于深度学习的自然场景下多语种古文字图符识别问题研究

来源 :中央民族大学 | 被引量 : 0次 | 上传用户:ztcld2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
古文字图符记录着一个民族的文化和历史,是语言学、民族学、文献学等相关研究领域重要的研究对象。对于古文字图符的研究,传统上采用手工的方式,效率低下,不利于记录、交流和传播。采用先进的数字化技术对古文字图符进行研究的需求越来越迫切。本论文的研究课题来源于“2014年度国家社会科学基金重大项目”(14ZDB104),目的是实现基于图像的符号自动识别与检索,建成总体数据库,方便用户的使用、交流,提升研究效率。该项目涉及文字22种(少的81个符号,多的有2000多个符号),绝大部分不包含在1990年出版的《中国民族古文字图录》和中华字库工程内容当中。针对古文字图符的自动识别任务的需求,前期做了大量调研,然而没有发现古文字图符自动识别问题的相关资料,可借鉴的很少。最终,我们选择了目前在众多视觉任务中表现效果优异的“深度学习”技术来完成课题任务。论文采用增量学习的思想,探索了一套完整的工程实践方案,分为三个阶段进行:第一阶段,对深度学习技术与传统方法进行对比实现了基于卷积神经网的10分类识别任务,并对深度学习技术在古文字图符研究工作中的应用进行总结,;第二阶段,将迁移学习技术应用到了古文字图符识别领域,探索、解决了古文字图符样本少、分类多的问题;第三阶段,研究近一两年来比较热门的生成对抗网络,采用基于卷积神经网的生成对抗网络,通过随机生成样本来优化模型,使得模型拥有识别自然场景下的图符的能力。经过三个阶段的研究工作,在测试集上取得了很好的测试效果。论文工作主要有:1、针对研究课题,提出了一种针对小样本、多分类、自然场景图符识别问题的解决方案;2、针对训练数据的不足,根据需求不同,提出了三种数据增强方案;3、结合工程实践,对于卷积神经网的结构和参数问题进行了深入的研究。总结了可视化、样本特征空间、网络表现力等多个角度的网络评估方法,整理了网络优化方案。最后,论文实现了基于Web端的古文字图符检索系统,并且充分考虑了系统的扩展性,为后续工作的进行奠定了基础。
其他文献
在各种自然灾害中,旱灾是发生范围最广、频率最高、影响最重的灾害。近年来,随着自然灾害损失加剧,减灾工作日益受到各国政府的重视,学者们展开了大量旱灾灾情及其风险感知方
多媒体的传输和显示涉及色彩空间的转换,转换的过程需要大量的数值计算。基于FFmpeg的色彩空间转换方法主要利用CPU进行计算,而大规模矩阵数值计算更适合在GPU中进行并行运算
【正】 转化不良资产,使沉淀的资金再度复活,是银行向商业银行转化中一项难度很大的工作。如何面对不断变化的市场。适时注入少量资金,抓住机遇。救活企业也救活自己的“资产
本研究以210名中职生为被试者,研究他们的时间管理倾向与自尊的关系。研究结果表明,中职生的时间管理倾向与自尊存在显著正相关;高自尊分别与时间效能感呈显著正相关、与时间
<正>http://www.dispatch.com美国俄亥俄州自然资源部公布的数据显示,尽管全国范围内页岩气钻探进程已全面放缓,但俄亥俄州去年因水力压裂而进入地下水循环系统的压裂液数量
在学习中心论理论的指导下 ,随着学习者自主精神的提高 ,学习者能根据所需完成任务的情况 ,有意识、有目的地选用恰当的策略 ,并能独立、自主地承担起学习的责任
我国亟待建设一套针对页岩气的行之有效的环境监管机制。美国在页岩气开发中形成了一套以政府为主导、以权力监督为主线,以社区为主要关注点、以权利监督为侧重,以第三部门为辅
<正> 1989年年末东欧和苏联的剧变,悬而未决的欧洲经济一体化、东西德的统一及日本对全世界的影响一——所有这些问题都将深刻地影响着九十年代,并将决定二十一世纪的进程。
文章针对昆山市道路沿线杆件多、距离近、辨认难、景观差等问题,分析国内外城市道路共杆建设成功经验并借鉴应用。将道路分成交叉口、分合流段和一般路段三个杆件综合设计区,
针对传统制造加工设备在生产加工过程中存在设备与数据信息联系不紧密,设备使用维护多依赖于人工经验等问题,提出了一种新的设备智能化方法。首先,在信息层建立能反映制造加