基于Android平台的图像文字识别及语音播放系统

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:xyfan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
据统计全球约超过1.5%的人群因视觉方面的障碍不能像正常人那样学习和生活,图像文字识别和语音播放技术在一定程度上可以为他们提供阅读帮助。虽然目前市场上已有基于Androi d终端的类似产品,如云脉文档识别、OCR(Optical Character Recognition)文字识别等,但这些识别软件对图像拍摄要求较高,往往要求拍摄的文字清晰、图像不能倾斜、图像仅仅只包含文字等,否则将无法识别或者导致识别准确率降低,故这些要求对于存在视力障碍人群并不现实。为此本文研究开发了基于Android的文字图像识别软件,并增加了语音播放的功能,使用者可通过听觉获取文字信息。本文完成的主要工作如下:首先,提出文字图像倾斜矫正和文字区域裁剪算法,并通过灰度化、二值化、倾斜矫正和文字区域裁剪等过程降低了待识别的文字图像冗余信息,实现了文字图像的预处理。然后,基于google公司优化的tesseract识别引擎开发了文字识别功能,并通过训练和扩展字符库的方法来提高文字识别的准确率。最后,基于手说TTS(Text To S peech)引擎开发了语音播放功能,该功能不仅可以播放识别出来的文字,而且可以以不同性别、不同音量、不同语速进行播放。通过对该系统进行测试验证了本文开发的基于Android平台的图像文字识别及语音播放系统的有效性,并且它同市场上应用最广泛的识别软件之一的云脉文档识别进行了识别对比,验证了其在识别有倾斜或者包含非文字部分的文本图像时效果更好。
其他文献
目的探讨肠道细菌移位研究的进展。方法复习2000年至2005年6月关于肠道通透性的改变、肠道菌群失调和全身炎症反应综合征(SIRS)的文献。结果随着对SIRS和MODS的深入研究,越来
一般性的财产给付执行规则并不完全适合于抚养权的执行。我国抚养权的执行出现了严重的虚置现象,这种虚置现象主要是由规范上的模糊和司法实务界"财产给付执行中心主义"共同
目的研究氟桂利嗪联合银杏达莫治疗老年后循环缺血性眩晕的临床疗效。方法收集2008年6月至2011年6月老年后循环缺血性眩晕患者70例,随机分为对照组和治疗组各35例。对照组给
<正>技术创新、需求引领和思维转变驱动着互联网应用的广度和深度不断拓展,传统行业的产品和服务也正被互联网深刻改变着。"互联网+"以跨界融合创新浪潮正席卷经济社会各行各
目的探讨显微外科夹闭手术与血管内介入治疗颅内动脉瘤的临床效果及应用价值。方法回顾性分析120例符合诊断标准的颅内动脉瘤患者的一般资料,按照随机、对照的原则分为观察组
<正> 《罗密欧与朱丽叶》是英国文艺复兴时期伟大的戏剧家莎士比亚的戏剧作品,《娥并与桑洛》是我国傣族在历史过程中流传下来的叙事长诗,是古代的优秀作品,1958年才由云南民
随着道口安全面临的形势越来越严峻,道口安全已经成为企业安全生产的重要环节。本文以华菱涟钢2250铁路道口的实际情况为例,分析了涟钢铁路道口存在的安全问题,从设备更新,技
社会工作作为一门专业助人活动,其专业性的问题是这个专业是否具有接受性的前提。本文采用参与式观察法以笔者的社会工作实践为基础,同时采用半开放型访谈法对9位一线社工进
期刊