论文部分内容阅读
作为人工智能领域的一个热门研究问题,如何让计算机更加准确地了解人们的意图,一直是该领域研究的主要方向。目前手绘草图已经成为人机交互又一重要方式。针对目前跨领域手绘草图识别方法存在普适性较差的问题,本文意在通过对现有技术的研究,提出一种普适性较好的手绘图符特征提取算法。 在数据集方面,本文从网络上收集了日常生活中常见目标的250类手绘图符20000个,其中包括GB/T11797—2005标准中规定的28种机动车和非机动车的车符约2400个,手写数字、手绘电路元件、手绘微软办公软件形状图各1000个,以此作为本文研究的数据集基础。 为了研究手绘图符特征的普适性,本文首先研究了手写文字识别,特别是手写汉字识别的主要处理流程与处理方法,分析了其识别过程中的重点和难点,比较了手写汉字与手绘图符的区别与联系。其次,分析Eitz等人对人为识别手绘图符的研究实验,并在此基础上设计了两个实验,针对影响人们是否能够正确识别图符的因素进行分析,确认了图符的轮廓是人们识别一个图符的重要依据,而在轮廓出现语义模糊的情况下对细节信息的把握是区分图符的关键。 在特征提取方面,主要从局部细节和全局轮廓两个方面提取一幅手绘草图的特征。在局部细节特征提取上,利用弹性网格来吸收手绘过程中的变形,利用局部梯度直方图来表示图符的细节特征,分析了模板大小、梯度空间、梯度方向个数对实验结果的影响。在全局轮廓特征提取方面,创造性地引入Snake模型用于手绘草图的轮廓提取,修正判别能量函数,改善了初始轮廓选取的不便,再利用傅立叶算子,提取了低维轮廓特征,最后与局部细节特征融合,提高了图符识别率和算法的适应性。 实验结果显示本文轮廓特征能够提取多种情况下的图符轮廓,并在图符识别准确率方面,比单纯弹性网格HOG特征的识别率平均提高2个百分点。