【摘 要】
:
文字识别过程是集模式识别、图像处理和文字处理相结合的一种技术。藏文印刷体识别是藏文信息处理的重要组成部分,这种技术能成倍节约藏文字录入、编辑和处理等工作成本。对
论文部分内容阅读
文字识别过程是集模式识别、图像处理和文字处理相结合的一种技术。藏文印刷体识别是藏文信息处理的重要组成部分,这种技术能成倍节约藏文字录入、编辑和处理等工作成本。对藏文相关新闻出版印刷业、办公自动化、古籍资料的整理和数字图书馆等领域有重要的应用价值。与其它文字相比,藏文具有横向字丁间距紧密和纵向字丁层数不同的音节结构特征,而且音节分类数目众多,这对藏文印刷体识别研究带来了挑战。传统的藏文印刷体识别是以藏文字丁为分割单位,采用规则与统计相结合的识别方法。随着信息技术的进步和发展,神经网络模型在图像识别领域取得了巨大的成功,这类模型可以在大规模数据集上,学习更长分割单位的结构特征,能够有效提高识别系统的性能。因此,本文以藏文乌金字体为研究对象,展开了藏文音节为识别单位的研究工作。主要完成了如下工作:1.本论文为了解决训练图像与标签对齐问题和构建高覆盖度的藏文音节文本语料库,深入分析研究藏文字组合结构,提出了基于混合模式的藏文文本音节切分方法,并研发了藏文自动音节切分系统,通过此方法共搜集了626类藏文字丁和19450类音节文本语料库。2.针对藏文字体非常紧密、文本图像分割难度大的问题,本文提出了以音节为单位的图像文本分割算法和图像空白边缘规范化算法。该分割方法能正确分割存在字丁与字丁的粘连现象,减少文本图像分割错误的几率。在无干扰的四种藏文文本图像上分割准确率达99.31%,并构建了藏文字丁和音节为单位的标注数据集各30500、132500。3.本文提出了基于音节特征向量的藏文乌金印刷体识别模型,基于音节的模型抗干扰和泛化能力更强,识别效果比字丁好。针对基于音节的模型进行了参数优化,测试准确率比原先80.83%提高了16.39%。4.通过整合藏文预处理模块、分割模块和识别模块,研发了藏文乌金印刷体识别系统。本系统可以任意旋转和裁剪用户感兴趣的图像部分,这种半自动矫正功能提高了使用用户的体验感和操作感。系统分割每0.283秒分割一个音节,每0.018秒识别一音节,在四张无干扰的藏文文本图像上平均识别率达96.53%。
其他文献
有机发光二极管(OLED)作为如今极具发展潜力的新一代照明显示技术,因其具有高效率、低功耗、广色域、可柔性制备等特点,已经在固态照明和全彩平板显示领域有许多应用。为进一
异常点的检测是数据挖掘方向上一个非常重要的研究分支,其主要目的是挖掘出那些行为显著异于其他数据对象的数据。随着物联网技术的兴起,高速、无限且动态的高维数据流在生态
随着近几年来人们对于安全问题逐渐重视,以及监控技术和存储设备的不断升级,公共区域被大大小小的监控网络设备所覆盖。由于涉及个人隐私,监控摄像头不能够遍布各个角落。因
随着流媒体技术的高速发展,实时性视频传输被广泛应用到社会的各个领域,涉及到人们日常生活的方方面面。无论是日益常见的远程教育,还是形式多样的生活直播,甚至是政府企业的
变截面钢管混凝土格构柱是以钢管混凝土为柱肢、空钢管为缀杆,截面尺寸自上而下逐渐增大的结构。此类结构有整体稳定性好、承压能力和结构刚度大、延性高、造型美观、节约材
科技发展带来的用户终端多样化以及物联网的普及,使移动数据流量迅速增长。为了满足用户的需求并缓解网络容量的压力,传统蜂窝网络逐步转向小型化、密集化,最终形成超密集网
通信过程的信道编码,实质为差错控制编码技术,不仅仅是5G技术体系之内,之前的4G、3G、2G等等,其通信过程的实现,都是以信道编码技术为基石。为了能够满足5G技术中增强移动带
随着社会经济的迅速发展,电力系统成为推动社会发展的重要的支撑力量。智能电网的建设势在必行。智能电网建设重要的一步就是智能电网信息化。一方面,电力网络信息化技术可以极大改善电力系统的管理,合理的配用电,减少资源的浪费。另一方面,电力网络信息化可以产生大量的电力数据,利用现有的大数据分析与挖掘技术,对电力数据进行分析和挖掘,提取出有用的信息,产生更高的价值。针对基于互联网的用户端智能配用电平台性能不足
在开采石油的工作过程中,能够实时、精确地获取石油矿井下的温度、压力等参数是十分必要的。通过对参数的分析,采油工作者可以了解储油层的情况,并为后续注水加压和其它开采
一座城市的政府工作报告是对其过去一年的工作回顾与总结,并重点陈述第二年的总体要求和主要目标任务。本实践报告以《新乡市2020年政府工作报告》为翻译实践文本和分析案例,具有较强的实用价值,能够帮助外国游客以及关注新乡市发展的人们,更好地了解近两年新乡市政府的重要工作概况,尤其是2020年新乡市政府工作的总体要求和主要目标任务。本文首先概述选题背景、文献综述、翻译原则、研究意义和文章结构;然后从词、句