图像理解的概念学习方法

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:onlysunnyfei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去几年里,很多基于深度学习的图像理解方法都得到了快速发展,特别是在字符识别领域。但是基于深度学习的字符识别方法不仅面临着训练所需数据量大、参数多、计算资源消耗大等问题,而且其泛化能力较弱。概念学习是一种类人的学习方法,模仿人类在极少样本和先验知识条件下进行高效的学习,从而具有较强的泛化能力。与常有的深度学习模型不同,概念学习方法在一定先验知识基础上只需一个训练样本即可实现概念模型的建立。针对深度学习方法存在的不足,我们以中文手写字符和工业字符图像为实验对象,在进行字符合理分割和字符笔画表示的基础上,利用概念学习方法建立字符概念模型,进一步实现字符图像理解。本文主要完成工作如下:1.手写汉字可能由于连笔的书写习惯,而工业环境中的字符图像可能打印在形状复杂和不均匀的各种材料的表面,从而导致残缺和接触字符出现。针对接触字符特点,根据粒子群优化(PSO)和支持向量机(SVM)的三特征模糊分割策略,对接触字符进行合理分割。2.由于概念学习方法需要将整体拆分成不同的部件,故需要对字符图像进行合理的拆分和表示。在字符笔画拆分和提取的过程中,由于容易产生冗余的特征点导致笔画拆分失败。本文提出了基于笔画宽度的去除冗余特征点方法以及基于距离直方图方法实现对畸变骨架的矫正,从而实现字符笔画的合理提取。另外由于概念学习是基于统计学习方法,需要将笔画由不同的参数表示,并统计出不用参数服从的概率分布。3.根据笔画表示、笔画先后顺序以及笔画之间的连接关系建立单个字符概念模型。在已建立概念模型的基础上,采用蒙特卡罗马尔可夫链采样方法,对采样得到的样本进行相关参数变化生成拟合模型。通过计算拟合模型概率值来判断目标样本的种类。最后利用朴素贝叶斯决策可以有效地辨别出极其相似的字符。4.为了验证本文提出方法的适用性,不仅对自己在工业场景中收集到的工业图像数据库进行评估,包括对接触、残缺和相似字符数据集进行实验并取得不错的识别准确率。也在公共数据集ICDAR 2013和NIST SD 19上表现出不错性能。
其他文献
逆向知识转移是指知识从跨国公司子公司到母公司的转移,是母公司获取东道国独特的知识资源,不断提升其竞争优势的关键举措。现有关于知识转移的研究大多聚焦于发达国家跨国公司的传统知识转移,逆向知识转移研究尚处于起步阶段。本研究将海外子公司自主权和逆向知识转移进行了不同维度和类型的划分,通过理论研究与实证验证,深入探究海外子公司自主权对逆向知识转移的作用机制,并引入母公司吸收能力作为调节变量,以期揭示其在自
限制通行措施是道路交通安全管理部门应对近年来日益严峻的道路交通安全管理形势所采取的一种抽象行政行为,其目的是通过对道路通行主体通行权优先等级的区别化设定,达到提高
互联网技术突飞猛进,图像数据规模呈指数倍增长。图像分类是获取图像中有效信息的重要手段,在服饰领域,现有方法大都基于服饰整体进行处理识别而忽略细节部位特征;“AI+时尚”的到来,使得人工智能技术和商业场景紧密结合,快速准确地对服饰进行识别分类,已成为学术界和产业界又一关注的热点领域。针对服饰属性的标签识别,本文设计并实现了一种基于深度学习的服装属性标签识别的方法,采用来自阿里电商数据的网络服饰图像数
近年来,国内食品安全事件频发,引起了公众对食品安全问题空前的关注。食品安全问题对公众造成了严重的身体损害和财产损失,并且将整个社会都笼罩在巨大的阴影中。惩罚性赔偿
改革开放四十年以来,特别是2000年正式提出并实施“走出去”战略和“一带一路”倡议提出后,中国企业境外投资开始步入快车道。当下,随着供给侧结构性改革的深入推进,中国产业结构层次虽取得了一些进步,但是产能过剩严重、产业整体素质偏低,产业结构仍不尽科学合理,严重阻碍了中国经济的发展。因此,加快培育新兴产业,改造提升传统产业,发展现代服务,积极推动我国产业结构持续优化,已是刻不容缓。本文基于2008-2
鸡蛋过敏是人类食品安全的重大问题。目前,避免鸡蛋过敏最直接和有效的方法是,忌食鸡蛋或含鸡蛋成分的加工食品。然而,随着食品工业的发展及食物配料的多样化,避免食用这类食
随着建筑业的发展,城市化速度的加快,砖混结构房屋被拆除产生大量的废弃粘土砖和废弃的混凝土。处理和堆放这些建筑废弃物,不仅要花费较多的资金,还严重污染环境。将建筑废弃
随着现在微电子技术的不断发展,纽扣电池的使用量与日俱增,这也进一步增加了纽扣电池制造企业的生产量。纽扣电池的质量检测是纽扣电池生产线的一个重要环节,然而传统的质检环节往往是用人工的方式去检测并分拣,这阻碍了纽扣电池生产效率的进一步提高。本文在已有的并联机器人机械结构与电气系统的基础上,从硬件和软件两个方面进一步研究和设计并联机器人的控制系统,使其可以控制并联机器人运动并配合机器视觉系统去完成纽扣电
作为一种非常重要的数学模型,积分方程被广泛应用在流体力学、弹性力学、电动力学、电磁场理论、辐射学、生物学以及人口问题当中,非线性Fredholm积分方程作为积分方程的一个
3-甲基吲哚是一种重要的精细化学品及合成中间体,在工业、医药及农业等领域有广泛的应用。如何简单、绿色、高效地合成3-甲基吲哚一直是研究的重点和难点工作。由苯胺与生物