人工智能飞行副驾驶语音识别技术研究

来源 :中国民用航空飞行学院 | 被引量 : 0次 | 上传用户:dddff628
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术作为人机交互的一部分,对于实现机器智能化至关重要。将机器人作为民用飞机的副驾驶是民航业未来重大突破和创新的方向,语音识别技术应用在机器人副驾驶上可以使机长的命令直接送达副驾驶程序中,使得机长和机器人副驾驶配合成为可能。语音库是实现语音识别的基础,目前研究学者们在做关于中文语音识别所用到的语料库大多是清华大学所公开的,但是该语音库不适合特定的研究方向。当下语音识别方式分为传统语音识别方式和端到端的语音识别方式,传统语音识别方式发展成熟,识别效果好,但是程序太过繁琐。针对以上背景,本论文以A320机型驾驶舱的监控飞行员与把杆飞行员之间的标准喊话为基准,建立了标准喊话语音库,然后应用端到端的语音识别方法——基于CTC的语音识别方法搭建识别模型。论文首先对机器人作为飞机副驾驶需要经历的过程、传统语音识别方式和端到端的语音识别方式的原理及过程、循环神经网络和语音库进行了详细的总结与阐述。其次建立了标准喊话语音库,语音库特征为:包含22条标准喊话,并将22条标准喊话分成了六组,录制语言为普通话,录制语音库的样本人数为150人,全部来自于中国民用航空飞行学院,他们具有民航专业背景,并且普通话非常标准,年龄在22岁到32岁之间。语音信息容量是1800条,拥有较高的泛化能力。针对飞机飞行过程中驾驶舱的噪音,进行语音增强。采用主观评价方法对谱减法和基于对数的最小均方误差(MMSE-LSA)方法的语音增强效果进行判断,决定采用MMSE-LSA方法降噪。再次建立了基于CTC的长短时记忆循环神经网络(LSTM)语音识别系统。该系统有效的抑制简单循环神经网络在模型训练过程出现的梯度消失和梯度爆炸现象,该神经网络语音识别系统在训练和测试方面对于标准喊话基本可行,但是错误率比较高,训练的错误率是31%,测试的错误率是45%。论文最后针对上述现象对模型进行了优化,采用两种方法,即基于CTC的Bi-LSTM循环神经网络语音识别模型和基于CTC的Bi-GRU循环神经网络语音识别模型,两种优化模型对于训练和测试的错误率都有相应的降低,尤其是基于CTC的Bi-LSTM循环神经网络语音识别模型,训练的错误率降到1.2%,测试的错误率降到3.2%,最终采用该种语音识别模型作为实际应用的人工智能副驾驶的语音识别系统。
其他文献
政府投资项目是一个在实践中不断深化的概念。改革开放以后,全能政府向有限政府转变,市场主体开始丰富起来,政府资金的管理、投向和效益情况越来越受社会关注,加强政府投资项目管
目的:比较肾囊性病变患者超声造影(Contrast-enhanced ultrasonography,CEUS)与计算机断层增强扫描(Contrast-enhanced computed tomography,CECT)的不同征象特点,比较二者在诊断良恶性肾囊性病变中的诊断及鉴别诊断价值。方法:对2017年9月-2019年9月我院常规超声诊断为肾囊性病变的患者59例进行CEUS与CECT检查,以手
2000多名在岗职工,1000多名退休职工,从来不拖欠工资、医疗保险、养老费等,郑州饮食总公司在员工眼里充满希望。在外来菜系不断冲击下,郑饮率领广大员工,一直肩负着振兴豫菜
数学操作题具有新颖、开放、灵动、创新、思辨等其他题型无法比拟的独特性而成为近几年中考的热门题型.操作题能综合考查学生猜想与推理、抽象与建模、直观与想象、理解与运
随着高中新课程改革的不断深入,现行的高中《体育与健康》课程标准中新的教学理念对教师提出了更高的要求,它要求教学中要激发学生的运动兴趣,培养学生终身体育的意识;以学生发展
岩石物理实验是研究煤岩储层物性参数、孔隙特征与吸附机理的重要手段,但由于煤岩具有致密、孔渗相关性差、孔隙结构复杂等诸多特点,使得常规的岩石物理实验方法应用于煤岩岩
乡绅作为传统社会乡村治理的中坚力量,扮演着不可替代的中间角色,在维护传统社会稳定发挥了重要作用。从传统社会到现代社会,乡绅的角色和作用发生了巨大变化,虽然他们不再是乡村治理的主体,但是由于新乡贤群体具有文化和历史特性,因而他们在乡村治理中发挥着不可替代的作用。本研究运用文献研究法、实地调研法、历史分析法等研究方法,以结构功能主义为分析框架,立足于乡村振兴,选取乡村振兴的重要参与群体新乡贤为研究对象
语文是学习和工作的基础工具。如何在小学水平的基础上,正确理解和运用祖国的语言文字,具备基本的阅读、写作、听话、说话能力,培养学习语文的良好习惯,提高语文学习能力,是初中学
目的: 在神经根型颈椎病治疗中,采取超声引导神经根阻滞,观察其临床疗效.方法: 选取2015年1月-2017年1月,到我院进行治疗的神经根型颈椎病患者72例.将患者随机分为两组,观察组3
目前,我国高技能实用型人才需求结构与应用型高等教育培养结构尚未实现充分对接,“用工慌”与“就业难”依然并存,导致大学毕业生找不到工作,而应用型院校深化校企合作是化解