Arabic and English Scene Text Detection using Conv

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:gzqeedaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能和深度学习在图像分类方面的成功,研究界将其兴趣集中在利用深度学习的能力来促进各种过去被认为具有挑战性和不可能实现的任务。深度学习取得很大成功的一个领域就是自然图像中文本的检测。随着越来越多的数据和更好的计算资源的可用性,将深度学习应用于场景文本检测和识别已经取得了很大的进展,一些最新的结果有时甚至超过了人类的能力。在这一领域,对于其广泛的商业应用来说,在更具挑战性的场景中检测文本方面正在取得进展。然而,尽管在自然图像中检测具有挑战性的文本取得了巨大的成功,但大多数方法和数据集的焦点都集中在对场景图像中出现的属性的一个方面进行攻击。大多数可用于场景文本检测的数据集都包含一个主要是拉丁语脚本的单一语言文本。在创建和管理可用于深度学习模型的多语种培训的数据集方面,进展有限。由于各种语言数据集的可用性有限,研究特别侧重于解决现有数据集中图像中经常出现的挑战。
  本文试图将文本检测的领域扩展到包含不同语言文本的图像中,并为这些实例的本地化创建一个深度学习模型。首先,提出了一个1200幅图像的数据集,该数据集主要由英语、阿拉伯语、波斯语和乌尔都语四种语言的场景文本实例组成。这个数据集还包含一小部分图像,其中包含希伯来语和普什图语的文本实例。为了融合多样性,模仿自然条件,并引入挑战元素,这些图像从大范围收集,具有巨大变化,如水平文本、垂直文本、长文本和聚焦文本、短文本和模糊文本、弯曲文本和不规则文本实例。设计了一个端到端卷积神经网络,它由三部分组成:使用ResNet-50提取特征,然后逐步合并,以提高网络对所有文本实例的回忆能力。预测头将图像分为文本/非文本区域,文本实例的头/尾以及使用头和尾部分的边界框的偏移。实验结果表明,在ICDAR-MLT数据集上,一个简单快速的多语种文本检测模型的准确率、查全率和h均值分别为0.90、0.65和0.76。
其他文献
内容摘要:马洛版《浮士德博士的悲剧》沿袭了关于人吃禁果而堕落的主题。该剧未及描写弥尔顿式的英雄,也没有像斯宾塞那样刻写一部道德书,更未像莎士比亚那样写实地描写人世一切冷暖情仇,而是人在宇宙中能享有的一切可以享受的世俗内容。基督教传统道德认为人应尽善、尽美且无欲,但浮士德这个人物的重心却在于他对世俗物质的渴望,成为了马洛笔下的另一撒旦。浮士德对世俗欲望的追求体现了文艺复兴时期的人免除精神枷锁以后的现
期刊
内容摘要:美国女作家唐娜·塔特的成长小说《金翅雀》于2014年获得普利策小说奖,小说中以名画“金翅雀”与主人公的纠缠为主线,主人公通过对视觉艺术品的认知,在不同阶段用不同的眼光来观察、感知和言说再现,形成不同的统觉,并经由语象叙事呈现出主人公成长中内心的不同阶段,其中“解剖课”成为了主人公习得创伤和陷入困境的现实具象,静物画成为定格自己内心创伤的休憩之所,“金翅雀”完成了主人公对人生和存在的顿悟,
期刊
内容摘要:盖斯凯尔夫人的小说《南方与北方》,公认为维多利亚时期描绘工业绅士的代表著作。维多利亚时期作为工业革命的重要发展阶段,英国阶层相应更迭。其中中产阶级最为显著的变化,就是工业绅士的涌现。《南方与北方》以女性为观察者,以二元對立为视角,以误解原则为叙事手法,比较了工业绅士与维多利亚社会评论家的绅士观念,全面地展现出维多利亚时期工业绅士的内涵、践行和价值。  关键词:盖斯凯尔夫人;《南方与北方》
期刊
内容摘要:安妮塔·布鲁克纳小说《杜兰葛山庄》中女主人公埃迪斯·霍普的服饰选择与其身份建构紧密相连。服饰不仅是埃迪斯表达女性立场、反抗男权社会压迫的方式,也是让她陷入消费社会物质陷阱、丧失主体性的消费符码,服饰更是促进她在写作中自我反思和身份重建的动因。文章以服饰文化为切入点,并结合消费社会的时代背景,深入分析埃迪斯的成长历程,探究服饰与女性身份建构的内在耦合关系,进而揭示男权社会及消费市场对现代女
期刊
内容摘要:陕西当代长篇小说是陕西文学的重要组成部分,其英译活动是陕西文学走向世界的重要途径,亦承载着讲述中国故事的重要使命。本文考察陕西当代长篇小说英译与接受概况,缕析国内外译介研究现状,发现陕西当代长篇小说英译数量有限、接受效果不佳、研究热度不足,并从文本方面与非文本方面提出针对性建议,以期为中国文学外译提供启示借鉴。  关键词:陕西当代文学;译介与接受;中国文学外译  基金项目:本文是陕西省社
期刊
新能源的发展是世界持续关注的重要问题,可再生清洁能源中的太阳能以其突出的优点被世界各国所推崇。如今光伏发电效率低是限制太阳能发展的技术难题,如何有效提高光伏发电效率成为了重要的研究方向。目前对提高光伏发电系统发电效率的研究大致分为两个方向,分别是通过追踪全局最大功率点来提高发电效率和着重于如何在传统的DC-DCBoost升压电路中改进优化拓扑结构进而提升效率两个主要研究方向。
  大量搭建在户外的光伏发电设备因云层、建筑、树荫等物体的遮挡会影响光伏电池板的发电功率,在光伏阵列输出特性曲线上产生多峰值
内容摘要:自19世纪犹太启蒙运动以来,现代希伯来文学一直在启蒙犹太民族意识形态中扮演着先锋作用。希伯来小说在教育以色列人和现代犹太人方面扮演着重要角色。通过分析不同历史时期的三部希伯来小说,本文考察现代希伯来文学对民族性的教导与反思,及其随着复国主义思想的发展而发生的演化。在以色列建国前的伊休夫时期(1920-1950年代),“?????”(故土、祖国)是美育、文学、和地理教育的重要核心,小说家萨
期刊
基于多光谱遥感影像的分类是对地观测的重要手段,同时也是农作物精准预测的重要手段。在众多的多光谱图像农作物分类算法中,深度学习作为一种新颖的分类算法,能够自动从大量数据中获取到合适的映射关系,提取出分类特征,进而实现分类识别功能。然而深度学习神经网络同传统分类算法一样需要合理地选择特征还有模型结构,此外由于地区与时间的不同导致的多光谱图像的不同,分类算法极有可能在其它区域不适用或分类精度下滑严重。针对上述情况,本文做出了以下工作:
  1、对多光谱图像的时间,空间,光谱谱段建立神经网络模型,并分析模型
高光谱图像蕴含着丰富的空间特征和光谱特征,在环境保护、军事打击、农业生产等领域中发挥着重要作用。在图像重建领域上,使用少量的数据重建出质量较高的图像,将对信息的存储和传输带有极大的便利。稀疏表示在光谱分类和图像重建中有着重要的应用,并取得了良好的效果。但基于稀疏表示的光谱分类和图像重建需要采用传统优化算法进行迭代更新,而优化算法存在一些问题,使得其无法达到最好的分类结果和重建精度。一方面由于传统优化算法需要设置合适的参数,但参数的设置具有随机性,参数的选择困难。另一方面由于传统优化算法需要进行多次的迭代才
每天都有数以百万计的视频被制作并上传到网上,其中大部分视频的内容都没有经过审核。此外,VideoEditor、AdobePhotoshop、WindowMovieMaker、以及AdobeAfterEffects等视频编辑软件也被广泛使用。这些软件支持各种各样的视频编辑方法,即使编辑后的内容与原始内容有很大的反差,视频内容也能被随意编辑。
  此外,随着深度学习技术的快速发展,已经出现了自动将一个人的脸部替换为另一个人脸部的视频编辑软件,如FakeApp、Faceswap等工具。这导致人们看到这些视