基于A*和连通区域的藏文古籍文档行分割

来源 :阜阳师范大学 | 被引量 : 0次 | 上传用户:flyingmomo1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
藏文古籍在我国各民族遗存的古籍文献中占据着重要地位,承载着藏族的文化和历史。但是由于藏文历史文献存放的时间太久,许多古籍图像文字出现模糊或者缺失,甚至有些文档无法翻阅,亟需数字化保护和整理。藏文古籍图像识别是数字化保护的重要组成部分,而藏文古籍图像行分割是字符识别的一个重要步骤。本课题主要研究藏文古籍图像行分割,针对藏文古籍图像的特点,提出了两种藏文古籍图像文本行分割的方法,主要内容有以下两个方面:(1)提出了基于连通区域的藏文古籍行分割方法。由于藏文基线数代表文本行数,所以本文通过估计基线来确定文本行大概位置及行数,且扩展生长算法能够分割粘连。方法先对藏文原始图像进行二值化、倾斜校正等预处理,对图像进行水平行投影,得到投影直方图后进行平滑处理,进而通过峰值检测来估算文本行的基线位置。其次根据估算的基线位置获取文本核心区域,并结合原二值图像得到伪文本连通区域。然后通过基于广度优先搜索的扩展生长算法,生成伪文本行图像,最后根据断裂笔画的质心和文本核心区域边界的距离,实施行归属处理,实现完整的文本行分割。结果表明,本方法能够更加准确的检测文本行数量,文本行分割准确率达到94.22%。(2)提出了基于A*算法的藏文古籍行分割方法。A*算法能够自动寻找切分路径,能够分割粘连。上元音会影响路径的查找,提前处理上元音,对方法优化,能够避免这个影响。该方法首先对藏文原始图像进行二值化、倾斜校正等预处理,对图像进行水平投影,得到投影直方图后进行平滑处理,通过峰值检测确定文本行位置和数量。其次利用检测出的峰值求出文本核心区域,根据该区域提取出上元音,并对上元音做行归属处理。再把提取完上元音的图像分成7块,利用A*算法对每块分别处理。在该算法寻找文本行切分路径时,选取5个代价函数,计算从行切分起点到终点的代价,寻找最小代价路径作为文本行分割路径。最后合并分块的文本行、上元音归属、旋转恢复文本行原始角度,得到最终文本行分割结果。实验结果表明,该方法能够有效解决行间粘连、重叠等问题,取得了较好的文本行分割效果,算法的综合性能指标达到99.3%。
其他文献
在实际生活与工程应用中存在优化目标数较多且目标相互冲突的问题,这类问题被称为多目标优化问题。当目标个数大于3时,也可以被称为高维多目标优化问题。由于传统的多目标优化算法在面对高维多目标优化问题时性能下降,并且随着优化问题目标维数的上升,算法在目标空间的搜索会越复杂,优化算法复杂度也会随之增大。因此亟待设计出更加高效、性能更优的算法来解决高维多目标优化问题。随着人工智能领域中的机器学习算法快速发展,
学位
直升机运动参数中的旋翼共锥度,可以为直升机的研制与维护提供指导意见,提高其测量精度,对保证直升机安全飞行有至关重要的作用。然而,在利用桨尖偏移量进行旋翼共锥度的测量过程中,由于旋翼高速旋转,导致桨尖线速度过大,图像出现局部运动模糊,影响了测量精度。为提高桨尖偏移量的测量精度,需要对桨尖图像进行去模糊处理。据此,本文利用深度学习,开展了直升机桨尖图像的去模糊方法研究,主要工作与成果如下:(1)针对现
学位
本文考虑了Lüroth展式中一类字符分布的度量性质,即Lüroth展式中相邻字符的乘积的部分和序列Sn(x)=sum from i=1 to n(di(x)di+1(x))的度量性质,其中di(x)表示实数的Lüroth展式的第4)个字符.具体而言,本文主要研究了两个问题,一个是Lüroth展式相邻两个字符乘积的部分和序列Sn(x)在适当增长函数下的依测度收敛问题,另一个是部分和序列Sn(x)满足
学位
网架结构是一种常用屋盖结构形式,有时为了满足屋面开洞的需求,网架上也需要开洞。目前,对开洞网架结构设计缺乏明确规定,研究也较少。因而,研究开洞网架结构的力学性能和优化设计具有较强的实用价值。本文以周边简支的开洞正放抽空四角锥网架结构为研究对象,进行了以下几个方面的研究:(1)对比了5种荷载工况下正放抽空四角锥网架开洞前、后结构最大位移和杆件最大应力,确定了结构较不利工况。在不利工况下对比分析正放抽
学位
本文主要研究了一类具退化强制性的椭圆与抛物方程解的存在性及正则性。首先,本文研究了一类具Hardy位势的非线性椭圆方程解的存在性与正则性。最初考虑F=0,构造其逼近问题并选取合适的检验函数得到解的先验估计,进而证明弱解的存在性和正则性。然后,通过单独估计div F这一项,再结合F=0时得到的结果来讨论≠0时的情形。其次,主要研究了一类具退化强制性的各向异性椭圆方程解的正则性。通过选取合适的检验函数
学位
向量拟均衡问题在数理经济学、工程技术、数学规划、社会经济学科等方面都有着广泛的应用。常见的向量均衡问题、多目标均衡问题和向量变分不等式问题等均为广义强向量拟均衡问题系统的一些特例。当今,随着问题解相关问题研究的深入,众多学者已经开始关注系统解的研究。本文目标是在拓扑线性空间中,研究了集值广义强向量拟均衡问题系统,并得到了其系统解的通有稳定性、本质连通区和适定性的相关定理。主要内容如下:第一章是绪论
学位
本文主要研究了带波动算子的非线性Schr(?)dinger(NLSW)方程的Du Fort-Frankel差分法及其理论分析。本文共四章,具体研究工作如下:第一章介绍了 NLSW方程的应用背景、研究现状和本文的主要工作。第二章建立了求解一维和二维NLSW方程齐次Dirichlet边值问题的两类Du Fort-Frankel差分格式,证明了这些格式在离散意义下保持总质量守恒和总能量守恒。运用能量法、
学位
兴国必先强师。校本研修是促进教师专业发展的重要途径,也是改善乡村教育水平、落实基础教育“双减”政策要求、提升乡村教师整体素质的必要选择。但是,在现阶段,乡村教师研修在资源、管理、方式等方面与城市学校相比,还存在一定差距。随着网络信息传播技术的发展与应用,为乡村教师校本研修提供了新的发展机遇,同时也提出了更高的要求。如何立足于乡村学校教师发展的实际,特别是在当前新冠肺炎疫情防控常态化的背景下,探寻一
学位
自然语言处理和计算机视觉借助深度学习技术不断取得新突破,以图像和文本为基础的跨模态交互慢慢成为研究热点,视觉问答(visual question answering,VQA)任务作为多模态研究内容之一也越来越热门。视觉问答任务是计算机模型对输入的图像提取出视觉特征,对输入的问题提取出问题特征,经过跨模态融合得到图像和问题的联合向量,最后使用预测函数输出答案的多分类任务。相比于单一的计算机视觉或自然
学位
图像分割是计算机视觉的一个非常经典的难题,对图像分析和图像理解具有重要的支撑作用。图像分割的实质是对一副图像进行目标与背景的分离,从而提取出感兴趣的区域。图像分割技术的应用领域较为宽泛,如人脸识别、无人驾驶和安防监控等。图像分割在医学图像辅助治疗中也发挥着重要作用,医学图像分割是图像分割领域最为重要的研究方向之一。近年来,人工智能的不断发展使得群体智能算法被广泛的运用到图像分割算法中,并且取得了不
学位