论文部分内容阅读
古文字图符记录着一个民族的文化和历史,是语言学、民族学、文献学等相关研究领域重要的研究对象。对于古文字图符的研究,传统上采用手工的方式,效率低下,不利于记录、交流和传播。采用先进的数字化技术对古文字图符进行研究的需求越来越迫切。本论文的研究课题来源于“2014年度国家社会科学基金重大项目”(14ZDB104),目的是实现基于图像的符号自动识别与检索,建成总体数据库,方便用户的使用、交流,提升研究效率。该项目涉及文字22种(少的81个符号,多的有2000多个符号),绝大部分不包含在1990年出版的《中国民族古文字图录》和中华字库工程内容当中。针对古文字图符的自动识别任务的需求,前期做了大量调研,然而没有发现古文字图符自动识别问题的相关资料,可借鉴的很少。最终,我们选择了目前在众多视觉任务中表现效果优异的“深度学习”技术来完成课题任务。论文采用增量学习的思想,探索了一套完整的工程实践方案,分为三个阶段进行:第一阶段,对深度学习技术与传统方法进行对比实现了基于卷积神经网的10分类识别任务,并对深度学习技术在古文字图符研究工作中的应用进行总结,;第二阶段,将迁移学习技术应用到了古文字图符识别领域,探索、解决了古文字图符样本少、分类多的问题;第三阶段,研究近一两年来比较热门的生成对抗网络,采用基于卷积神经网的生成对抗网络,通过随机生成样本来优化模型,使得模型拥有识别自然场景下的图符的能力。经过三个阶段的研究工作,在测试集上取得了很好的测试效果。论文工作主要有:1、针对研究课题,提出了一种针对小样本、多分类、自然场景图符识别问题的解决方案;2、针对训练数据的不足,根据需求不同,提出了三种数据增强方案;3、结合工程实践,对于卷积神经网的结构和参数问题进行了深入的研究。总结了可视化、样本特征空间、网络表现力等多个角度的网络评估方法,整理了网络优化方案。最后,论文实现了基于Web端的古文字图符检索系统,并且充分考虑了系统的扩展性,为后续工作的进行奠定了基础。