论文部分内容阅读
由“活着的象形文字”——东巴文撰写成的东巴经典古籍集聚了几千年的纳西族文明,于2003年被联合国教科文组织列为“世界记忆遗产”。然而东巴经典古籍手稿散落于世界各地,难以收集整理,并且只有中国的东巴祭司可以释读其中的内容且均已年逾古稀,东巴文化的传承面临着断代的残酷现实。针对这个问题,本文将智能图形识别技术应用到东巴经典古籍的数字化上,采用现代化技术手段对东巴文化进行抢救与传承。 本文在对东巴文字的特点和现有的文字识别方法进行深入研究的基础上,提出了一种脱机手写体东巴象形文的识别方案,并设计实现东巴象形文智能识别系统。本文的主要研究工作包括: (1)设计CCD数字图像采集系统,实现对东巴经典古籍图像的数字化获取,存储和格式转换等。对东巴经典古籍图像的预处理方法进行论述和实验验证,通过图像去噪、二值化、边缘检测、文字切分、细化和归一化等处理,将东巴经典古籍图像拆分成一个个便于识别的东巴文。 (2)将模式识别中的结构特征和统计特征结合起来,提取东巴象形文字的拓扑特征、网格特征、笔画方向特征,使每个东巴文都能区别于其他的东巴文图像。采用TrueType技术建立东巴文模板字库,运用Unicode技术进行编码,用于东巴文匹配识别。 (3)采用多级识别的方式,将模板匹配方法和神经网络识别方法的优势结合起来,设计并实现东巴象形文智能识别系统。随机选取东巴经典古籍图像进行实验验证,结果表明本文设计的系统不仅具有较高的识别率,还具有较快的识别速度。