无分割满文单词识别方法研究

来源 :北方民族大学 | 被引量 : 0次 | 上传用户：miracle_l

【摘要】

：

“满语”和“满文”是满族的语言和文字。清朝将满文作为法定文字推广和使用,留下了大量满文档案。这些满文档案可谓包罗万象,涉及面极为广泛,且所反映的内容多不见于汉文档

【作者】

：

黄荻

【出处】

：

北方民族大学

【发表日期】

：

2018年01期

【关键词】

：

无分割满文识别有向无环图支持向量机卷积神经网络空间金字塔池化数据合成

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

“满语”和“满文”是满族的语言和文字。清朝将满文作为法定文字推广和使用,留下了大量满文档案。这些满文档案可谓包罗万象,涉及面极为广泛,且所反映的内容多不见于汉文档案和其他文献,具有重要的历史研究价值。满文濒临灭绝的现状迫切要求加强对满文历史文档的数字化保护。随着图书馆满文数字化的日益增长的需求,研究满文光学字符识别技术变得非常重要。在以往的满文识别研究中,通常是对切割后的字符或基元进行识别。由于满文单词结构的复杂性,尚不能完全实现满文字母的正确分割,制约后续字符识别的精度,同时识别后的字符重组技术也有待解决。所以,本文提出了无分割满文单词识别方法,主要研究内容如下:1.本文提出利用多项式核函数的有向无环图支持向量机分类器,对无分割满文单词进行识别分类。分类器在10分类时达到100%,从20分类识别率开始下降,在40分类时识别率为90%,在100分类时达到78%。实验结果表明,无分割满文单词识别方法具有可行性;并且对于大类别数的无分割满文单词数据,有向无环图支持向量机的分类效果明显下降。2.为了提高在大类别数据测试集上的识别率,使用卷积神经网络对无分割满文单词进行识别分类。不同于人工设计好的浅层特征提取器,卷积神经网络能对深层特征进行提取,从而提高识别率。利用卷积神经网络对100类的无分割满文单词进行识别分类,识别率达到99.10%,比有向无环图支持向量机的识别率高出21.10%;对671类无分割满文单词进行识别分类,识别率达到97.89%。实验结果表明,卷积神经网络适用于大类别的无分割满文单词的识别分类问题。3.为了使分类器能够对任意大小的无分割满文单词图像进行分类,而无需进行大小归一化处理,利用空间金字塔池化层替换传统卷积神经网络的最大值池化层的方法来改进传统的卷积神经网络,使网络可以对任意大小的无分割满文单词图像进行训练,从而减弱归一化预处理对识别率的影响。实验结果表明,改进的卷积神经网络模型对无分割满文单词的识别率达到了98.84%,高于传统的卷积神经网络对无分割满文单词的识别率。4.在对深层神经网络的训练中,需要大量的实验数据。但是由于满文单词文本少,搜集的数据量不大,使本文的实验具有局限性,所以本文利用数据合成方法对原始满文数据进行扩充,得到适合于以上三种方法的无分割满文单词数据集。实验结果表明,利用无分割满文单词数据合成方法进行扩充的数据集适用于以上三种识别分类方法。

其他文献

（Photoshop图像处理》选修课教学的实践与思考

本文以《Phopshop图像处理》选修课教学为基础，结合教学设计理论和多年的教学经验，就该课程在教学内容的设计、教学方法的使用和教学评价等方面的问题做了探讨和阐述，并取得了良

期刊

PHOTOSHOP公选课教学教学设计教学方法

基于“数据大脑”的大连智慧警务建设对策研究

根据以人为核心的新型城镇化发展要求,利用“数据大脑”对城市公共安全数据资源进行实时全面的解读处理,实现城市社会治安治理模式优化,已成为智慧警务建设的重要研究课题。本文从公共管理角度对大连公安智慧警务建设进行分析,并提出“基于数据大脑建设的智慧警务建设”的思路,为智慧警务“升级版”建设提出对策建议。本文根据解析智慧警务建设的公共管理属性,提出主要观点如下:基于对大连智慧警务建设情况的了解,尤其是对智

学位

数据大脑智慧警务改进方案

海警舰艇勤务指挥仿真实验设计

依托海警舰艇勤务指挥仿真系统,设计、编制了海警舰艇勤务指挥仿真实验训练项目,对海警舰艇勤务指挥想定,以及实验准备阶段、实施阶段和分析阶段的内容作出说明。以想定在东

期刊

舰艇勤务指挥执勤预案仿真实验tactical command operational plan simulation experiment

研究生教育之反思——以华南师范大学为例

研究生教育是一种精英教育，因此保证培养质量是非常重要的。时常反思在教育过程中的不足之处，建立良好的研究生教育培养机制，才能使学校立于不败之地。

期刊

研究生教育课程教学反思

拟人化营销对顾客忠诚度的影响研究

企业营销的目标是与消费者建立牢固的关系,通过营销手法提升顾客忠诚度,以提升营销效益。拟人化是人类一种有趣的现象,拟人化的营销手法对提高顾客忠诚度也有影响。运用文献

期刊

拟人化营销顾客忠诚度影响关系调查研究

低出生体重儿121例病因分析和临床管理

本文通过对１９９３年我院出生的１２１例低体重儿的临床分析，总结了我院低出生体重儿的发生率、病死率、发生原因，提出降低低出生体重儿病死率的管理经验及预防办法。

期刊

宫内发育迟缓早产儿低体重新生儿病因分析

提高水运工程的概算质量

1前言水运工程与其他建筑工程相比，具有承受的作用复杂（波浪、潮汐、海流、冰棱、风、地震等自然力和使用、施工荷载）、施工条件多变、建设周期长、投资较大、工期要求紧等特点；

期刊

水运工程质量概算建筑工程施工荷载施工条件建设周期影响因素

ALBI评分对符合米兰标准的肝细胞癌术后并发症的预测价值

目的:评估术前ALBI评分对符合米兰标准的肝癌患者术后并发症的预测价值。方法:纳入2009年至2016年间接受开放肝癌切除术的400例符合米兰标准的肝癌患者。采用受试者工作特征(

期刊

肝癌ALBI评分肝切除术并发症hepatocellular carcinomaALBI scorehepatectomycomplication

“毛泽东思想和中国特色社会主义理论体系概论”课专题式教学初探

专题式教学作为“毛泽东思想和中国特色社会主义理论体系概论”课教材体系向教学体系转化的有效载体，其逻辑建构和教学实践对实现课程实效性具有重要意义。在实施中，专题式教学

期刊

毛泽东思想和中国特色社会主义理论体系概论专题式教学实施

基于模糊推理的多源信息生猪异常行为综合监测

在畜禽养殖过程中,生猪异常行为发生比较普遍且种类繁多。通过人工观察、记录生猪行为异常情况,需要耗费大量的人力和物力,并且带有一定的主观人为因素,无法满足目前养猪业规

学位

生猪异常行为综合判断模糊推理综合加权相似度多源信息监控系统

无分割满文单词识别方法研究

与本文相关的学术论文