基于特征字符的印刷体公式识别研究

被引量 : 0次 | 上传用户:a272437762
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和互联网的普及,人们越来越多地使用计算机存储和传输信息。但如何提高信息的传输速率成了一个亟待解决的问题。为了解决这些问题需要研究有效和实用的方法来将文本形式的文件转变为相应的电子格式的文件,这是一种能够被当代的数字计算机处理并通过互联网输送的方式。通过计算机来自动识别字符,是将由字符组成的文本高速录入计算机的唯一可行方法。目前广泛应用的OCR系统对手写、印刷体文本都有很高的识别率,但是对公式却一直没有好的识别方案,公式识别成为模式识别领域一个研究的热点。 公式识别按照公式书写格式的不同可以分为印刷体公式识别和手写体公式识别,本课题研究的是印刷体数学公式识别。我们研究一种新的、基于特征字符的印刷体公式识别方法,并开发完整的算法,将印刷体的数学公式(图像格式)转换成可编辑的电子格式。 按照系统的设计与开发方案,本文主要分为以下四个部分: 公式图片的预处理。我们获得的待识别公式图片大多含有噪声,是没有进行过二值化、细化、大小归一化等方法处理的图片,直接进行识别难度较大,这样,我们首先需要进行图像预处理的工作。 字符的分割和识别。我们得到的待识别图片是一个整体的公式,需要知道公式包含的各个字符以及各个字符之间的位置关系,这样,我们就需要分割出公式包含的字符以及识别这些字符。本文采用基于连同域方法完成字符的分割,并采用模板匹配的方法进行字符识别。 公式的结构分析。得到公式包含的字符类别信息和位置信息后,我们采用基于特征字符的方法进行结构分析,这是本文的核心部分,在提出结构分析方法的基础上,我们开发公式识别的算法。在这一部分还给出Word EQ域语法的使用方法,并用它表达结构分析的结果。 软件的设计与实验。给出公式识别DEMO程序的结构、主要函数、界面并最后给出实验示例和实验结果。
其他文献
文章以未成年人公民权利义务教育为主要研究对象,主要目的在于分析阐明公民权利义务教育的含义和内在关系,论述未成年人公民权利义务教育的重要性和必要性,以及就如何加强未成年
为建立适宜大蒜(Allium sativum L.)的SSR反应体系和扩增程序,应用L16(45)正交设计对影响SSR-PCR的主要参数进行优化。结果表明,适宜大蒜的SSR反应体系总体积为20μL,其中含T
本研究通过在安定区团结乡唐家堡对Aspen、9303、法瓦维特、甘啤2号、甘啤3号、甘啤4号等6个啤酒大麦品种的形态特征、抗逆性、品质、产量及经济效益等指标的试验研究及综合
本文首先介绍了永磁偏置磁悬浮轴承的工作原理、系统组成及其优缺点。在此基础上提出了一种新型单自由度永磁偏置磁悬浮轴承结构,对其磁场形态进行了有限元分析,同时设计了一
<正>先是拿下了国家旅游局AAAA级旅游景点,接着又迎来浙江省五星级文明规范市场验收,位于诸暨山下湖镇的华东国际珠宝城最近有点忙。山下湖,这个昔日只是靠养珍珠养家糊口的
集群犯罪是因人群聚集演变而成的具有巨大社会破坏力的犯罪,其在形成与发展过程中具有一定的规律可循。从集群效能发展为集群行为,再由集群行为恶化为集群犯罪,这是现阶段集
作为社会公平正义的最后一道防线,审判权的公正行使不仅关系到具体个案正义的实现,也关系到社会主义法治建设的大局。我国当下正在进行的司法改革,主要目标之一就是确保审判
党的十八届三中全会《决定》提出,全面深化改革的总目标是完善和发展中国特色社会主义制度,推进国家治理体系和治理能力现代化。关于全面深化改革、加快完善现代市场体系、坚
计算机技术、多媒体技术、通讯技术的迅猛发展与综合利用,使人类进入信息时代。个人面临全新的信息环境:网上的信息资源虽然极为丰富,但粗浅、重复的信息泛滥和信息垃圾充斥,与个