基于关键帧与深度学习的孤立手语识别研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:xiaoxianjihuoma
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手语利用手部形态的变化、手势的变化以及手部的空间位置变化来对语义或音节进行模拟,从而表示一定含义,是一门动作视觉语言。手语除了可以作为正常语言交流的辅助手段,更是听力方面有障碍或者聋哑人群进行交流表达的重要方式和主要工具,对于使用手语的需求与日俱增,然而手语的教学专业性强,普及程度较差。针对手语识别的研究,可以极大地保障听力障碍及聋哑人群的日常生活、学习、工作等权利,有着积极的社会意义。同时针对手语的研究也对智能生活有着极大的研究价值。本文基于深度学习对中文手语词汇进行识别研究,给出了一种基于关键帧提取与神经网络的手语识别方法。本文主要工作如下:(1)给出一种基于伪三维残差网络的手语视频特征提取方法。针对三维卷积参数量计算量过多影响网络计算成本和模型储存,从而限制网络速度和存储的问题,给出一种使用空间卷积和时间卷积结合代替三维卷积的方法,从而使得网络得以加深。又通过加入残差结构缓解网络加深带来的影响,从而获得深层信息。(2)给出一种关键帧切割手语视频关键帧定位方法。针对手语视频存在冗余帧使得网络学习无用信息导致性能下降的问题,使用Kinect关节点信息判断手部运动状态,通过分析帧间相似模型最终判断关键动作所在帧。仅对手语视频中关键动作所在帧进行特征提取进行手语识别。(3)给出一种注意力机制LSTM编解码手语识别方法。针对手语词汇包含的多个动作组成在理解含义时重要性互有高低的特点,结合自然语言处理知识,使用LSTM对关键帧序列特征进行编解码,并加入注意力机制实现解码时对编码信息的不同关注,从而提升识别准确率。最终本文方法在SLR_Dataset上进行实验取得了91.3%准确率的良好结果。
其他文献
汽车底盘的异物检测对于公共安全具有十分重要的意义。汽车底盘夹带危险品和违禁品,影响着人民生命财产安全和社会稳定。现有的相关车底检测的技术主要依赖于人工检测和二维图像检测,容易出现漏检情况。本论文面向行驶汽车设计了汽车底盘的三维成像系统,研究了汽车底盘多目相机三维重建算法。具体研究情况如下:设计了基于五目相机的汽车底盘图像采集系统方案。图像采集系统与车辆行驶方向垂直放置,车辆在系统的上方通过时,相机
学位
我国作为苹果的生产大国,目前在苹果分拣和质量检测环节,多用人工分级和机械分级,人为影响因素多,费时费力,并且由于分级标准不统一,导致最终检测结果准确率并不高。因此,如何快速、准确、客观地进行苹果分级,成为目前分级领域的研究重点。而在苹果品质检测方面,国内外虽也进行了一些研究,但大多仅停留在对苹果的内部成分进行检测与分析,如硬度、PH值等,且检测价格高昂。对于消费者而言,不仅希望得到外观美丽的苹果,
学位
近年来随着长江沿江经济和航运业的快速发展,船闸货运量不断攀升,三峡、葛洲坝船闸成为长江中上游重要节点的水利枢纽。但由于船闸的满负荷、超负荷运转使用,其结构安全隐患也愈加明显。船闸人字门在复杂的深水环境中频繁启闭,受低速重载的工况条件、闸门两侧巨大水压及启闭机运行状态的影响,会引发门体小位移量的跳动,产生门体共振、应力集中释放的情况,损伤门体结构,严重时将会发生门体病变,影响通航效率并造成严重的经济
学位
伴随社会的不断发展,高速里程数不断增长,道路管理与维护的需求也日益增长,若不及时对路面破损进行处理,路面破损与自然灾害相互作用形成恶性循环,威胁人们的行车安全。传统的人工检测效率低、检测速度慢、误差较大。由于路面中存在的诸多干扰,现有的路面图像处理算法误检较多,难以运用到实际的路面检测。根据实际路面破损检测中存在的多种挑战,本文研究了一种用于解决复杂干扰条件下的路面破损检测算法。该算法有效减弱了路
学位
随着海上交通的不断发展,船舶流量的增加给海上管理带来了巨大的挑战,对近海及远海船队无缝监测成了海上监管的重要问题。本文基于企业的项目,实现近海船队的岸基整体监控,以及远洋船队船之间的信息一体化功能。本文利用嵌入式技术、数据采集技术、无线通信技术,设计实现了一种基于嵌入式的船舶信息采集及传输系统,该系统以软硬件结合的方式,采集船队内各船只的加速度、角速度、角度、磁场、经纬度、卫星定位、水平和垂直位置
学位
无透镜数字全息显微成像系统具有体积小、成像视野大、可通过计算机处理图像信息、方便携带等优点,在微生物检测、医学研究等方面有较大的应用前景。在无透镜数字全息显微成像系统中获取准确的离焦距离是无透镜数字全息显微成像获得清晰的重建图像的关键。本文研究的基于无透镜数字全息显微成像系统的自动聚焦算法通过数学计算得到全息图像准确的离焦距离,无需使用外部硬件获取成像物体离焦距离,成功实现了准确、便捷的自动聚焦。
学位
目标跟踪是计算机视觉领域中的研究热点,被广泛应用于我们的生活中。目前基于深度学习的目标跟踪方法取得了巨大的成功,然而在跟踪过程中存在诸如背景杂斑、低分辨率、尺度变化、目标形变等干扰因素,使得在目标跟踪上的研究依然存在许多挑战。为了解决上述问题,本文以孪生神经网络模型为理论基础,结合在实际跟踪环境下的挑战,提出了两种具有创新性的高性能跟踪算法,具体的研究内容以及成果概括如下:(1)提出一种基于注意力
学位
在常规自适应算法中引入泄露因子的Leaky LMS算法能够有效的减轻权值漂移,减小算法达到稳态的均方误差,Leaky LMS算法一般应用在高斯环境中。Leaky LMP被推广应用在非高斯噪声环境中。本文在已有研究的基础上,对Leaky LMP算法进行扩展,研究Leaky自适应滤波器的LMS与LMP混合算法的瞬态、稳态和跟踪性能。在未知训练序列情况下应用CMA算法的盲均衡器能够精准的补偿信道特性,完
学位
伴随着互联网的飞速发展,如何表示与规划互联网中的知识成为了当下研究的焦点,这使得知识图谱应运而生。但是,目前的知识图谱仍旧处于发展阶段,尚未达到完善的程度。虽然知识图谱中含有大量的知识,但对于一些冷门的或者不常用的知识,其覆盖率依旧不足。目前的知识图谱中的知识均使用RDF三元组——即<头实体,关系,尾实体>——的形式表示,无法使用这个形式表示的知识就无法加入知识图谱中,这使得知识图谱的刚性非常大,
学位
随着云计算、大数据的迅速发展,应用系统提供的服务不断多样化,复杂软硬件系统运行状态的监控指标数据呈现出形态多样、随机性强、复杂相关性等特点,对异常检测方法也提出了更高的要求。当前对于监控指标的异常检测方法大多是针对单一指标或某一实体进行监控,并采用固定异常阈值的方法检测异常。由于故障传播等指标数据的特性,大部分方法不能有效的检测应用系统在运行中出现的异常,且不能对异常告警原因进行解释。针对上述问题
学位