基于深度学习的工业机械手语音控制方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lpflpf7337
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国智能制造业的迅速发展,各类造业企业传统的手工操作已经不能满足目前的生产需求,工业机器人正在加速地替代生产工人及其手工操作。为了实现工业机器人的智能化,首先要求工业机器人能够摆脱对设备的复杂操作并与工人进行自然交流,而自然交流就要求工业机器人能听懂和理解工人的语言。因此,通过语音控制工业机器人极其重要。本论文针对现有语音识别系统鲁棒性不强等缺点,提出了使用深度学习目标检测算法来识别语谱图的语音识别方法,并将识别结果应用于工业机器人语音控制中,具体研究工作包括以下方面:1.根据研究目的与内容,本论文确定孤立词和多字词语音指令集内容,并录制音频样本,录制环境为静音环境,测试环境分为静音环境和噪音环境。由于生产机器运行声音频率远远高于工人正常发声频率,而常用语音识别方法只考虑时域信息而忽略频域信息,因此本论文使用短时傅里叶算法对音频样本进行变换,以便得到兼顾时域与频域的干净语谱图,并使用归一化处理增强语谱图的显示效果。2.针对现有语谱图识别使用深度卷积神经网络和全卷积神经网络方法,本论文提出使用深度学习目标检测方法识别语谱图,使得计算过程只关注有效的时频交叉区域,而忽略时域上的发音空白和频域上的高频噪音,针对噪音频率高于工人发声频率的环境识别效果更好。本论文在实验中使用多种检测模型对语谱图数据集进行训练实验对比,得到安静环境下的识别错词率基本在10%以下,噪音环境下的识别错词率基本在15%以下,说明本论文的方法对于语谱图识别具有一定的作用,且鲁棒性较强。此外,根据目标检测算法Faster RCNN计算量较大等缺点,本论文改进了网络结构,降低了计算难度。3.本论文使用目标检测算法识别语谱图的语音识别系统,在训练开始之前需要对检测对象的尺度进行先验框选择,这有助于提高预测准确率。由于语谱图有效区域的尺度比例与日常所见物体的尺度比例相差较大,故本论文使用机器学习聚类算法k-means对预选框进行聚类,以便得到各个检测模型效果最好的先验框。4.本论文设计了工业机器人语音控制系统,使用ROS仿真软件进行模拟实验,将目标检测语音识别方法得到的文字传送到ROS系统,控制工业机器人做出相应的生产动作,实验结果表明本论文提出的方法具有良好的实用性。
其他文献
科斯定理的存在需要特定的条件,当该条件不满足时,就需要采用“法律模拟市场”来配置产权。产权保护要遵循一定的原则,但法和经济学对科斯定理的拓展存在着无法克服的矛盾。
针对传统的实训教学的现状,将任务驱动教学法应用于Java实训教学,能充分调动学生的学习积极性,提高学生的自主学习、解决问题的能力和团队合作的能力,实训效果大大提高。
在竞争不断激烈和高度全球化的世界经济体系中,企业被寄予的期望越来越高,企业不单单是一个盈利组织更是一个需要承担相关责任的社会单元。企业社会责任问题关系到可持续发展
秋季来临,母羊普遍性欲旺盛,抓紧秋配,不仅受胎率高,而且成活率也高,9~10月份配种,次年2~3月份就可产羔,当年育肥即可出栏。对于那些生殖器官正常,长时间不发情或错过发情期的
目的探讨MRI在子宫内膜癌诊断和分期中的价值。方法12例临床怀疑子宫内膜癌的患者经MRI检查后行手术治疗,依据FIGO分期原则将MRI分期与临床分期进行比较。结果MRI分期准确率为75%,其中Ⅰ期和Ⅲc期患者
目的进一步探讨肝囊肿发生率与年龄和性别的关系.方法我们近年来对健康体检的5800例肝囊肿分析结果总检出率4.67%卡方检验:;男性组、女性组、混合组、各年龄组肝囊肿的发生均
我院自1996年7月~1998年3月,对30例膀胱癌患者于术前经尿道膀胱腔内超声判断临床分期,并与术后病理分期结果对比,旨在评估经尿道膀胱内超声对膀胱癌分期的价值,报告如下。1临床资
目的 :探讨聚焦解决模式在老年慢性肾功能不全病人饮食指导中的应用和效果评价。方法 :按照入选标准和排除标准共纳入60例老年住院慢性肾功能不全病人,分为实验组与对照组各3
原料仙人掌、白糖、过氧乙酸、精盐和柠檬酸。