论文部分内容阅读
进入新世纪以来,人们每天面对着各种现在化数字媒体信息,最典型的数字化信息缩影——图案,承载了很多有价值的信息,是人类获取外界知识的主要来源之一。与此同时,图案识别技术的发展成为一个热点研究内容。图案种类繁多,随处都可以看到传输介质中含有较多信息的图案,其中图标图案和文本图案是基于内容的图案检索技术研究的重点研究对象。本文模拟人类对图案的认知识别机理,提出了一种基于阅读认知模式的特征提取方法,提取基于视觉信息的图案特征,并提出了一种基于基元拓扑关系建模的通用图案识别方法。利用人工神经网络的强大计算能力完成图案的基元建模,利用共形几何代数完成基元间关系的建模,结合隐马尔科夫模型的强大的处理时序数据的优势,实现了图案的整体拓扑结构建模。根据本文提出的图案识别方法,本课题利用图标图案和文本图案作为识别研究对象,利用滑动窗的滑动过程模拟人眼观看图案时视网膜中心的移动过程,在滑动窗移动的过程中提取出基于视觉认知信息的图案特征,完成二维图案到一维特征向量的整体转换。识别模型中采取的基于共形几何代数(CGA)的人工神经网络(ANN)和隐马尔可夫模型(HMM)相结合的混合模型实现了对图案的建模。CGA具有将待处理的几何问题转换为代数问题的简化等能力,因此可以对识别对象间具有共形几何体部分的内容的分析转换为代数描述的聚类问题。ANN具有强大的自组织适应能力,学习计算能力以及抗干扰等优势,HMM又拥有强大的处理时序数据的特点,因此,通过CGA的基元关系建模将ANN和HMM进行连接成混合识别模型很适合本课题所提出的通用的图案识别方案。本文利用结构相对简单的图标图案和结构较为复杂的文字图案来检验本课题提出的识别方案的有效性和普适性。根据实验结果可知,该识别方案在不同的识别对象的应用中不仅可以给出良好的识别结果,还可以很好的体现出计算机模拟人类认知识别图案的机理,实验中以部分信息丢失的图案作为实验材料时,仍然可以得到较为理想的识别结果,体现出识别方案的抗干扰变形的能力和良好的鲁棒能力。