复杂背景下女书图像字符分割提取方法研究

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:jly1211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
女书是中华民族文化宝库的瑰宝,是世界极其重要的非物质文化遗产。由于各种原因,近年来女书处境艰难,亟待信息化保护。采用现代科学技术来数字化女书对女书的传承和发展具有重大的意义,其中女书字符分割提取是后续规范化工作和文字识别的关键步骤。本文围绕复杂背景下女书图像字符分割提取展开研究工作。根据复杂背景下女书字符图像特征,设计并实现了女书图像字符分割提取总体方案,并对女书图像字符分割提取的关键技术,字符图像分割和字符切分进行了深入研究。  在图像分割的过程中,针对复杂背景下女书字符图像和女书字符结构特点,设计并实现了一种改进的局部自适应女书字符图像分割方法。针对女书文字书写整体倾斜,其笔画只有点、竖、斜、弧四种,且以竖、斜和弧这三种笔画居多的书写特点,设计了基于CLLT的女书字符图像分割算法;依据女书字符笔画宽度字符宽度不均匀的特点,设计了基于MLLT的女书字符图像分割算法;结合LLT及ALLT局部阈值算法的基本思想,设计相应的阈值修正参数自动获取方法。最终给出了一种改进的局部自适应女书字符图像分割方法(IALLT),该算法较好适应了女书字符的特点,解决了LLT算法对笔画宽度w敏感及阈值参数需手动设置的问题,实现了局部阈值参数的自适应获取,从而进一步提高了算法的分割准确度及抗噪能力。实验结果表明,本文算法准确度较高,具有较好的适应性,对复杂背景下女书图像进行分割获得了令人满意的结果。  在字符切分过程中,本文以纵向书写字符图像为例进行研究,设计并实现了一种多策略女书字符切分方法。采用投影法对女书文本行进行粗切分,统计平均字符高度,并根据平均字符高度筛选出弱切分块;对于弱切分块中呈现字符重叠的现象,采用连通域分析法将其分离;对于弱切分块中呈现字符粘连的现象,结合字符细化图像的聚类结果获取粗切分位置,然后采用改进的滴水算法获取准确切分点,进而完成切分。实验结果表明,该方法能有效地对女书字符进行切分。
其他文献
继电控制系统是最早采用的控制系统之一,其控制动作可靠、控制装置比较简单,在各种场合中得到了广泛应用。在继电控制系统的设计、运行和维护等各阶段,都需要对其进行功能分
随着Internet技术的迅速发展,网络规模的逐渐扩大,网络资源的日益丰富,使得网络用户之间的资源共享和信息交流越来越普遍,网络文件共享系统成为网络资源方便共享的重要途径。为了
随着电信企业业务运营支撑系统的建设逐渐完善,电信企业的经营分析系统建设已经成为近年来各电信企业的信息化建设重点。基于数据仓库的经营分析系统能够为电信企业的分析与决
随着WebServices技术的逐渐普及,企业或组织有必要更多的了解其特征和性能。为了保持WebServices的开放性以及支持多客户类型,安全性问题应最先考虑。用户需要去了解怎样保护We
移动互联网是下一代网络发展的趋势之一,移动IPv6 是移动互联网的基石。 目前,移动设备越来越多,这些设备也迫切地希望能在任何地点、以任意的接入方式(有线或无线)、用固定
图像检索涉及到的研究范围比较广。本文仅对图像检索中所涉及到的图像分割、图像的自动语义标注以及标注图像的语义分类等几个关键性问题,进行了深入和系统的研究,提出了一些新
分布式查询优化的研究领域是分布式数据库中的研究热点。由于集中式数据库和分布式数据库的区别在于,分布式数据库需要站点间的数据传输。所以大多数研究分布式查询优化以减少
单元测试是为了发现软件设计的最小单位(程序模块)中存在的错误而进行的测试工作。作为软件项目中最早介入的测试工作,单元测试是集成测试和系统测试的基础,单元测试的成功与否
认知无线电(Cognitive Radio,CR)由于其动态分配频谱资源特性,能帮助认知用户在不影响授权用户的条件下伺机地使用某段空闲频谱,实现授权用户与认知用户之间频谱资源的共享,解决了
AdHoc网络是由一组带有无线收发装置的移动终端组成的一个多跳的临时性自治系统,是一种无中心的分布式控制网络。网络中各节点既是主机又充当路由器,可以通过无线链接构成任意