藏文现代印刷物版面检测技术研究

来源 :西藏大学 | 被引量 : 0次 | 上传用户:wjlayt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
藏文现代印刷物是藏文化资源的重要组成部分,藏文现代印刷物的版面中文本行包含了许多重要的信息,有效的检测出藏文版面中的文本行区域是实现藏文化资源数字化保护的重要一步。本文采集到的藏文现代印刷物版面分为藏文现代图书和自然场景藏文版面,鉴于传统的检测技术还不能有效解决藏文现代版面分辨率低下,字体样式多变的问题,如何有效的实现藏文现代印刷物版面的检测,本文采用两种深度神经网络的目标检测方法,分别实现对藏文现代印刷物版面中的文本行区域的检测。主要贡献如下:第一部分,为了解决藏文现代印刷物版面中各个水平和近似水平的文本行区域的检测,采用了基于Faster R-CNN的藏文现代印刷物的版面目标检测算法,先详细介绍了Faster R-CNN检测网络结构和算法原理,其主要思想是当区域建议网络提取到感兴趣目标区域,再进入Fast R-CNN网络得到藏文版面整体的特征图,最后Faster R-CNN判断出感兴趣区域属于哪个类别,在Res Net-50网络结构中进行数据集训练,实现文本区域的分类和定位。本文通过设置anchor为四种尺度,五种比例的情况,满足特征图上每个像素点可以生成20个尺度大小不同的anchor框,区域建议网络共生成1000个感兴趣的目标区域。实验表明,改进后的Faster R-CNN检测算法相比原始的Faster RCNN在藏文现代印刷物数据集上有更好的检测效果。在不同规模的藏文现代印刷物数据集上分别进行实验,都具有一定的检测效果。由于自然场景中的藏文版面本身的复杂性,自然场景中的藏文版面数据集上的检测效率比藏文现代图书数据集上的检测效率低,但整体上检测效果比较理想。第二部分,本文还采用了基于SSD藏文现代印刷物版面检测算法,实现大小比例不同的文本行的检测。首先将Res Net-50网络中的全连接层换为卷积层,在此基础上增加了辅助卷积层,通过利用第3到7层卷积层中的特征图,共提取得到五个尺度的特征图。其次对提取到的特征图上每个像素点分别设置生成五种尺度和五种比例大小不同的先验框,最终每个像素点共可以生成25种大小比例都不同的先验框,与真实框进行匹配,得到每个先验框对应的类别置信度和坐标位置,最后判断其对应的预测框是否为文本行目标,并对其位置进行回归,使其最大可能的接近真实框。经实验发现,该算法对藏文现代图书版面和自然场景藏文版面都达到了良好的检测效果。
其他文献
无线传感网络由分布在空间中的大量廉价传感器节点组成,由于其具有自组织、低成本和易于部署等优点,广泛应用于环境监测、智能家居、军事和工业等领域中。在这些应用中,节点
作为椭圆曲线密码体制(ECC)的推广,超椭圆曲线密码体制(HECC)的代数结构更加复杂,安全性更高,应用前景更加广阔。然而,HECC仍存在一些瓶颈问题亟待解决,其中尤为突出的问题是
车辆检测在辅助驾驶、交通管理、遥感图像等方面都有着重要应用,随着近些年车辆的不断增多,和人们对于车辆检测技术需求的不断提高,车辆检测已经成为目标检测领域的重要研究
神经元信息传递机制的研究,是脑科学领域内的重要研究课题之一,是人类对大脑的认知过程的重要环节,并且对于治疗脑神经疾病也具有极其重要的意义。近年来,关于神经信号传递机制的相关研究引起了相关领域研究学者的广泛关注。神经信号的传递机制研究尤以研究神经元的电信号为主,因此神经电信号的采集成为了重点研究问题之一,针对这一问题,本文提出并研发一套基于微电极阵列(Microelectrode Array,MEA
目前在工业生产线上,工业机器人对固定位置目标物体的抓取及搬运控制较为成熟,但是实际工业生产线上的目标物体的位置和姿态并不总是固定或规则的,当前对于这种位置和姿态不
近年来,随着人工智能技术的发展与成熟,其应用越来越广泛,自动驾驶则近几年国内外研究团队对人工智能技术的一个重点研究方向。车辆检测是自动驾驶需要完成的首要任务,使用多
多进制相位调制是无线通信中的一种主要调制方式,具有抗干扰性强、频谱利用率高、电路实现简单等优点,被广泛应用于卫星通信、民用移动通信中。其子类信号二进制相移键控信号、四进制相移键控信号和八进制相移键控信号的识别一直是调制识别领域中的热点问题。传统调制识别算法方法需要强大的专业知识和工程技巧来设计特征提取器,难以实现信号特征的自动提取。因此,本文将卷积神经网络应用到调制信号识别领域中,对多进制相位调制
工业机器人技术的发展日新月异,随着市场对机器人需求的加大,同时也让我国发展为世界最大的工业机器人应用市场,并为中国制造业的转型发展提供了巨大推动力,极大提升了该行业
“云计算”的概念由谷歌最早于2006年提出后,该技术当前在全球蓬勃发展,由最初简单的“数据共享”到如今的“应用共享”,改变了人们的生活。云计算技术同样应用在了政府的政
涡扇发动机是一种高度精密的热力机械。这种机械系统结构复杂,经常在极端环境下工作,极易发生故障造成不可挽回的损失。为了保障系统安全可靠运行,降低事故发生概率,预测它的