基于FPGA的盲人阅读器的设计与实现

被引量 : 6次 | 上传用户:shanon0577
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今社会中,99%以上的文字信息都是以可视化的纸质资料形式出现的,而盲人及视力障碍人士无法像普通人一样正常读书看报,视觉能力的缺失使他们无法以最直观的方式获取信息。盲人阅读器正是一种将可视化印刷品资料转化为声音信号,可供视力障碍人群直观获取信息的设备,该设备可使其在不借助他人帮助的情况下也能够方便地获取普通纸质文字信息。基于FPGA(Field Programmable Gate Array,现场可编程门阵列)的系统可充分利用硬件上的特性满足高速图像处理的需要,加上使用SOPC(System On a Programmable Chip,可编程片上系统)技术可使设计更加灵活,并实现软硬件在线编程及更新。本文设计了一个基于FPGA的盲人阅读器,以Altera公司的DE2开发板作为硬件平台,配合以CMOS(Complementary Metal Oxide Semiconductor,互补氧化金属半导体)图像传感器对纸质印刷体文字资料进行采集,VGA(Video Graphic Array,显示绘图阵列)显示器对采集图像和处理结果进行显示,当拨动相应的功能开关时,系统将通过音响输出识别文字内容后的语音信息。整个系统共分为图像采集、图像缓存、图像显示和文字识别四个模块。系统采用软硬件协同设计方式进行实现,其中图像采集、图像缓存和图像显示三个模块用Verilog硬件描述语言进行编写,文字识别模块通过搭建SOPC,在Nios Ⅱ IDE环境下采用C语言编程处理实现。其中,文字识别模块是系统的核心,关系到系统的性能。文字图像处理分为预处理、特征提取和匹配识别。本文讨论并分析了各部分算法的选取,在预处理部分采用中值滤波对灰度图像进行平滑去噪,再使用Otsu算法进行二值化处理,之后经过行字切分和归一化处理后,应用改进的八邻域细化算法提取出文字骨架。然后基于该单像素的文字骨架信息,对其包括端点、歧点、拐点及四叉点在内的特征点进行特征提取,并采用一阶Minkowski度量,即绝对距离度量,将特征向量与字典中的标准向量进行匹配识别,距离最短的即为识别结果。最后,在语音库中找到文字对应的语音文件,并通过音响输出声音信息。经过反复的调试和改进,该系统可以很好地实现盲人阅读器的功能。
其他文献
色彩语是生活当中较为常用的词汇。作为语言的重要组成部分,他在理解和表现这个多彩的世界时起到了至关重要的作用。本文针对色彩语在中日韩三国当中将起到何等作用的问题,详
任务型教学最早出现于80年代初,即Prabhu主持的班加罗尔交际教学实验。三十年来,各种研究任务型教学法的理论文献和实证研究层出不穷,充实着任务型教学法的相关知识。自2001年,国
社区是城市的基本组成单位,随着经济的快速发展和我国城市化建设的不断加剧,社区已经完全融入到城市居民的日常生活中,成为其必不可少的一部分。社区公共服务供给的好坏对于
面对海外品牌的大量涌入,中国企业致力于打造中国自己的品牌,而在品牌建设上,大多企业并未能掌握品牌的核心内涵,只有少数品牌在正确的品牌策略领导下高速成长。然而,即使是
近年来,博士研究生招生“申请—审核”制在我国部分高水平大学纷纷实行开来。“申请—审核”制有利于选拔出具有创新精神和科研能力的高素质人才,有利于提高博士研究生的培养
随着我国工业化程度不断加大以及人们生活水平的日益提高,由此导致的环境问题日益严重。光催化氧化技术在处理污染物时所需成本低、处理彻底、可循环使用,在治理水污染方面得到
液压支架是煤矿综采工作面上的关键设备,在综合机械化采煤过程中它所起的主要作用有:支护顶板、维护作业空间、推移工作面的采煤机和运输机,是井下采煤成败的关键因素,因此液压支
制动是地铁列车安全运行的生命线,在地铁列车的运行过程中,经常会出现地铁列车骤停的现象,严重影响到了列车的安全可靠运行。针对以上现状,本课题对地铁列车的制动技术进行了
根据我国《风景名胜区条例》,“风景名胜区是指具有观赏、文化或者科学价值,自然景观、人文景观比较集中,环境优美,可供人们游览或者进行科学、文化活动的区域。”风景名胜区
口供是证据链中重要的一环,但缺乏口供并不能影响证据链条的完整性。在零口供案件中,即使犯罪嫌疑人不作有罪供述,其辩解对于审查判断证据也是有积极意义的。本文通过论述提出了