基于深度学习的场景蒙古文字检测与识别研究

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:biggertree
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字作为人类高层语义信息中最直接的表示形式,在图像理解中扮演着不可或缺的重要角色。近年来,研究人员针对场景图像中英文、汉字等文字的检测和识别方法已经进行了深入研究,并取得了丰硕成果,但针对复杂场景图像中的蒙古文字检测和识别方法研究还处于起步阶段。在此背景下,本文主要研究内容如下:1.本文研究了一种基于深度学习和最大稳定极值区域(MSER)的场景蒙古文字检测算法。目前,由于缺少大规模场景蒙古文字检测数据集资源,无法训练得到鲁棒的深度检测网络模型,但基于MSER的方法不需要大量训练样本,且对视角、字符大小、光照变化具有鲁棒性。在MSER方法基础上,只需要相对较少的训练样本就可以训练出高效稳定的卷积神经网络(CNN)分类器,用来判断候选连通区域是否是蒙古文字区域。实验结果表明,所提方法能够良好地完成场景图像中的蒙古文字检测任务。2.本文研究了一种虚拟场景蒙古文字样本生成方法。在蒙古语言文字信息化的快速发展过程中,关于印刷体蒙古文档图像分析和文字识别方面已经开展了大量工作,但针对场景中的蒙古文字识别研究开展的较少。一方面关于蒙古语言文字的研究开展的较晚,另一方面由于缺乏大量的训练样本,导致无法将深度学习方法直接应用到该领域。本研究内容通过模拟真实场景中可能遇到的光照、遮挡、复杂背景、形变等环节干扰,生成了一个虚拟场景蒙古文字识别训练和测试数据集,以便于评估和改进现有方法。3.本文研究一种基于孪生网络的场景蒙古文字识别方法。蒙古文字是将蒙古文字母从上到下紧连着书写而成,内部局部形变小,而且蒙古文字类别大、训练样本不足,这些特点和人脸验证问题情况相似。所以本研究借鉴人脸验证中常用的孪生网络方法,并针对场景蒙古文字识别问题做了对比试验,将文字识别问题转化为计算样本之间的相似度问题。实验结果表明,所提方法能够有效缓解训练样本不足问题,提升场景蒙古文字的识别性能。
其他文献
基于属性加密方案(Attribute-Based Encryption,ABE)是一种新型公钥加密体制,利用将密钥和密文分别与访问控制结构或用户属性相关联,当且仅当用户属性集合满足访问控制结构方能解密数据,ABE被广泛应用到密文数据搜索和密文数据共享等领域。斯诺登事件的爆发表明,一些可证明安全的加密方案仍可能在实际部署中遭遇无法预计的后门攻击,在方案正常执行的情况下攻击者可以在用户设备上设计后门,
目的:通过获取乳腺癌新辅助化疗患者3.0T动态增强磁共振及弥散加权成像信息,分别探讨时间-信号强度曲线以及定量参数ADC、Ktrans、Kep对乳腺癌新辅助化疗疗效评估价值,为临床选择治疗方案、进行预后评估提供新的依据。方法:收集我院2015年12月至2017年8月术前均经穿刺活检病理证实为乳腺癌,并于我院进行新辅助化疗的患者40例,年龄3367岁,NAC68疗程,疗程结束后于我院手术治疗,并获得
目的:探讨绿茶提取物表没食子儿茶素没食子酸酯(epigallocatechin gallate,EGCG)通过抑制组蛋白去乙酰化酶2(histone deacetylase 2,HDAC2)改善苯肾上腺素(phenylephrine,PE)诱导的小鼠心肌细胞肥大的作用,为临床防治肥厚性心肌病提供新的思路。方法:一、选取1-3天龄新生昆明小鼠为研究对象,酶消化法分离获得新生小鼠心肌细胞,按照随机数字
目的:出血转化是介入取栓治疗急性缺血性脑卒中的主要并发症之一,其严重影响患者预后。因此,本研究旨在探索介入取栓治疗急性缺血脑卒中后继发出血转化的危险因素,通过危险因素建立预测评分模型来早期预测出血转化。方法:回顾性分析遵义地区多卒中中心介入取栓治疗的急性缺血性脑卒中患者的临床资料及取栓参数。通过术后48小时内动态头颅CT平扫将其分为出血转化组和非出血转化组。通过多因素logistic回归分析筛选出
冰结构蛋白(Ice structuring proteins,ISPs)是生物有机体为了适应低温环境而产生的一类特殊蛋白质,主要来源于昆虫、鱼、细菌、真菌和植物等有机体,具有热滞活性、冰晶形态
目的:为了改善双氢青蒿素(dihydroartemisinin,DHA)在体内的复燃率高、半衰期短的缺点并提高抗疟活性,采用DHA模型药物,以碳碳键(CC)、二硫键(SS)、间隔硫(SCS)和单硫键(S)为连接臂,甘油为骨架,合成四种DHA三聚体((DHA-CC)3、(DHA-SS)3、(DHA-SCS)3、(DHA-S)3),并制备成自组装纳米制剂((DHA-CC)3NPs、(DHA-SS)3N
目的:通过制作新生大鼠缺氧缺血性脑损伤(hypoxic ischemic brain damage,HIBD)模型,观察银杏叶提取物注射液(Ginkgo biloba extract,EGB)治疗HIBD过程中磷酸化Tau(phosphorylated Tau protein,p-Tau)蛋白表达情况,为EGB应用于新生儿缺氧缺血性脑病(hypoxic-ischemic encephalopath
石墨相氮化碳(g-C3N4),由于其独特的光电化学性质以及优异的结构稳定性,在光催化和光电转化领域上,引起了广泛的关注。相较于直接通过富氮前驱体热聚合制备的块体g-C3N4,具有
随着节能减排理念深入人心,电动汽车迎来了前所未有的发展机遇,电动汽车空调系统的核心部件涡旋压缩机随之成为了研究的热点。电动涡旋压缩机中动涡旋盘背面与支架体之间存在一定的微间隙,在电动涡旋压缩机正常运行的时候,背压腔中的润滑油有一部分会通过动涡旋盘与支架体之间的环形微间隙泄漏,这就会导致背压腔中背压力的变化,背压力的不足或过大都会影响电动涡旋压缩机的整机性能,若背压力不足,会造成动、静涡旋盘沿轴向方
各种装配中摩擦磨损的存在不仅降低了能量的传输效率,而且显著影响关键零部件的使役寿命。工程上最常用的减摩降耗手段是油液润滑,然而,高温工作环境中,液态润滑剂会迅速降解