嵌入式平台下场景图片中文字定位与识别的实现

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:xylzsh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网急速发展的今天,多媒体技术无不充斥着我们生活的方方面面,而作为信息丰富载体的图像,更是成了人们关注的主要对象。如何从复杂的图像中获取我们所需要的信息,成为人们今天关注的热点,而以场景文本为代表的图像,更是与我们的生活密切相关。本文从获取场景文本、场景文本中文字的定位和场景文本中文字的识别三个方面展开。在场景文本获取中,主要用到V4L2视频技术以及OpenCV相关库函数,并用交叉编译器完成程序的移植。在场景文本定位模块中,首先用到基于边缘检测方法完成对场景文本中文本域的粗定位,再根据灰度检测结果,将二者的连通域相融合,进一步来排除噪声的干扰,完成文本域的精确定位。在场景文本文字识别模块中,首先对文本块进行预处理,再训练训练集,在训练时要对训练集进行梯度特征提取和降维,之后一次加载训练集,用MQDF分类器来识别文本块,并把文字信息显示在输出界面上,最后通过微软TTS语音库把文本朗读。该系统满足一般的场景需求,未来可以用来处理一般的场景文本,包括马路边的广告牌、交通指示牌、宣传条幅、旅游广告牌、车牌等等。(1)通过把书籍或报纸上的文字转化为语音,来帮助有视觉障碍的残疾人,丰富他们的业余文化生活。(2)通过对高速路指示标志的识别,来提醒疲劳中的司机。(3)通过对各大旅游景点指示标志的识别,并转化为该国游客的母语语音输出,方便他们旅游。(4)对文献的电子化管理,汽车自动驾驶,危险预防等也有重要帮助。
其他文献
位置服务作为移动互联网时代的基础服务,在人们的日常生活中扮演着越来越重要的角色,据统计将近80%的应用与位置服务有关。位置服务中移动用户需要与位置服务提供商共享其位
运用语义万维网(Semantic Web)需要对传统的网络资源进行一些具有一定语义的标注。目前建立用于标注的本体(Ontology)是比较困难的。为了降低技术难度可以用一些具有结构化信息的
随着网络的发展及个人电脑的普及,越来越多的信息被发布到因特网上。Web信息门类齐全、数据量庞大,几乎无所不包,然而面对如此庞大的信息海洋,用户关心的只是其中很小的一部
为了确保网络时代的信息安全,国际上提出了基于公钥基础设施(PKI, Public Key Infrastructure)作为标准的信息安全体系结构,现己被普遍采用。在PKI中,最关键的实体是数字证书
随着Internet信息的迅速增长,Deep Web数据资源的数量急剧增加。然而,这些数据信息只能通过动态查询响应来获取,不容易被传统的搜索引擎如Google、百度搜索到,因此并未得到充
随着军用计算机网络蓬勃发展,渐渐深入到每个角落,网络管理问题随之而来。大型网络中心的网络管理问题受到空前的重视和改善,与之相对应的末端节点网络管理问题却一直没有很
近年来,人工智能广泛的应用于各个领域并得到了广泛的关注,智能割草机器人作为其代表产品,能够通过视觉传感器获取草地周围的环境,自动判断草地与障碍物,实现路径规划、自我
随着互联网络的发展,网络成了人们获取信息的重要工具。如何在互联网上有效地管理海量信息成了一项巨大的挑战,随之而来的内容管理技术和内容管理系统也成了热门的话题。内容
目前,问答系统作为一种新型的智能化的信息检索形式,作为一种更高效、更人性化的搜索引擎,已经成为信息检索和自然语言处理领域中重要研究方向之一。信息检索部分是整个问答
伴随着生活水平的改善,人们对身体健康的重视程度也逐渐提高。普适计算技术和信息化手段可以为人们“适时适地”地提供普遍适用的医疗服务与健康服务。为老年人以及患有多种