低质汉字骨架提取研究

来源 :四川师范大学 | 被引量 : 6次 | 上传用户:pinghua_xu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文关注骨架提取中的一个困难问题:低质汉字骨架的提取。由于低质汉字受到多种降质因素的影响,大部分现有的骨架提取算法并不能提取出符合人类视觉的且满足“好”骨架标准的骨架。本文首先提出了一个新的低质汉字模型:点云模型,用于提取低质汉字的骨架。点云模型能够充分体现现有汉字的底层信息特征,它不仅能将轮廓特征转变为笔画点特征,也为低质汉字和一般汉字的骨架提取建立了一个统一和可行的模型。在点云模型的基础上,本文将低质汉字骨架提取转化为一个两步的优化问题:首先找到与原始汉字拓扑结构吻合的线段集合(本文称为初始骨架),然后连接这些线段,以获得符合人类视觉和保持原始汉字拓扑特性的低质汉字骨架。本文综合特征分析、聚类、优化和随机场理论,提出了一种新的低质汉字骨架提取算法:首先利用点云模型刻画低质汉字;然后采用主成份分析方法对低质汉字点云进行降维,结合主成份分析方法,本文提出了一种增量广义K均值聚类的方法提取初始骨架;最后将初始骨架连接看成一个标记问题,并通过优化方法处理这类问题,本论文采用高层马尔可夫随机模型连接初始骨架,基于此模型,我们可以尽可能的加入汉字骨架和结构的先验信息(如角度差、平移差、端点距离)作为约束,从而使得这个标记问题得到最优解。本文的贡献主要有:首先提出了用点云模型来刻画低质汉字,然后基于此模型提出了一种低质汉字骨架提取的新算法,实验结果表明本文提出的新算法即使在严重降质的情况下也能够获得满足“好”骨架标准的骨架。除此之外,本文为低质汉字的骨架提取建立了全新的模型和理论框架,也为低质汉字骨架提取提供了一种全新的思路,相信能够启发低质汉字骨架提取的新方法和新思路的研究。
其他文献
近年来,图数据模型广泛应用于生物信息、计算化学、语义网等领域。现有的图数据查询处理技术大多基于频繁子图,是一个过滤、验证过程,即首先通过挖掘出来的频繁子图构造索引,然后
智能规划的研究是人工智能研究领域的一个重要分支,在具体的实际应用中具有重要的意义。虽然基于模型检测的规划方法发展时间不长,但是可以用其来解决很多问题,例如求解不确
词类划分与词性标注都是自然语言处理中重要的基础性研究课题,也是后续研究如浅层句法分析、文本分类、机器翻译等的基础。该课题的研究方法主要有三种:基于规则的方法、基于
遗传算法通过模拟生物自适应选择过程和自适应进化过程,通过不断迭代逼近最优解,可以将其用于求解高度复杂的非线性最优值问题。在对复杂的单目标问题进行求解时,遗传算法表
新一代网络计算是以大规模、分散控制、动态性、自治性和松耦合为主要特征的分布式计算,传统的点对点和同步通信已不能满足动态应用环境。发布/订阅(Publish/Subscribe)是一
随着生物技术的发展,产生了大量的生物网络数据。如何从这些生物网络数据中发现一些具有生物功能的拓扑结构成为生物信息学的一个研究热点。大量实验表明,模体是这些生物网络中
本文详细介绍了国内外温室控制技术的发展,根据国内外应用及发展现状,在对我国日光温室进行了全面调研后,认为针对日光温室设计的专家系统是日光温室控制的发展方向。这是因
多目标优化问题一直是科学研究和工程应用中非常重要的研究课题。进化算法具有解决多目标优化问题的优势,因其不存在对优化问题先验知识方面的要求,可以同时搜索到优化问题的
目标跟踪是指在一段视频序列中寻找与指定目标最相似的内容,是计算机视觉的一个重要研究方向。它在智能监控、人机交互、基于目标的图像压缩和国防工业中有着广泛的应用。在
随着计算机网络的发展,图书馆管理模式也受网络化的影响进入改革的时期。网络技术所引发的社会基础结构的变革、知识经济的兴起、信息技术的进步使信息资源的数字化存贮、处