用于襄阳方言语音识别的人机交互系统研究

来源 :湖北文理学院 | 被引量 : 0次 | 上传用户:madiawang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音交互是人和机器之间进行信号传输的一种较简单方式,人们只需要通过像日常一样的交流即可和机器之间进行互动,因此对语音识别技术不断进行突破,让机器可以更好的对人声进行识别,不仅可以改善人与机器之间的关系,让原本复杂的操作变得简单起来,而且也可以提高人对机器的操作效率。但目前,国内市场的智能语音产品多数是对普通话有较好的支持,在面对只会讲襄阳方言用户的时候,语音识别的准确率并不理想。本文针对上述问题,对用于襄阳方言语音识别的人机交互系统展开研究,以提高襄阳方言语音识别的准确率。本文主要完成以下工作:(1)构建了襄阳方言语料库,主要包含交通导航常用语句以及襄阳人日常交流中常用的特色词汇。在构建语料库的过程中,通过寻找志愿者进行语音采集,最终经过统一格式、切割、数据增强后获得了37760条语音数据,并完成了语音数据到标签文本的标注任务。(2)构建了GMM-HMM(Gaussian Mixture Model-Hidden Markov Model,GMM-HMM)声学模型以及DNN-HMM(Deep Neural Network-Hidden Markov Model,DNN-HMM)声学模型。首先对语音数据进行预处理以及特征提取等操作,然后利用相应的文本生成语言模型,进一步进行声学模型的训练。在实验中,随着声学模型的不断优化训练,GMM-HMM模型的语音识别准确率在不断提升,语音识别准确率最高可达86.72%。最后在GMM-HMM模型的基础上对DNN-HMM模型进行了训练与测试,结果表明DNN-HMM模型在襄阳方言语音识别中较GMM-HMM模型有更高的语音识别准确率,其语音识别准确率可达88.93%。(3)为降低襄阳方言语音识别系统的繁琐性,设计了基于CTC(connectionist temporal classification,CTC)的端到端襄阳方言语音识别框架,采用以中文音节即汉语拼音作为建模单元,先通过声学模型将原始语音信号转换为拼音序列,然后通过语言模型实现拼音序列向汉字的转换。在研究中首先设计了基于CNN-CTC的声学模型,进而在CNN-CTC模型的基础上进行改进,加入了对上下文具有较强表达能力的LSTM(Long Short-Term Memory)模型,设计了CNN-LSTM-CTC声学模型,经过实验测试表明,在襄阳方言端到端语音识别研究中,基于CNN-LSTM-CTC的声学模型语音识别性能较好,语音识别准确率要高。此外,因为在现有公开文献中对襄阳方言语音识别的研究还处于空白,本文是对襄阳方言语音识别的初探,所以在评价本文构建的襄阳方言语音识别模型时,采取相同的襄阳方言语音测试集在普通话语音识别系统中做了测试,最后通过语音识别准确率对比,验证了本文构建的襄阳方言语音识别系统的有效性。(4)在上述研究的基础上,基于python语言搭建了用于襄阳方言语音识别的人机交互系统,该人机交互系统具备语音识别功能和语料收集功能,最后经过测试,该系统所有功能可以正常使用。
其他文献
焊接是制造业中最重要的工艺技术之一,在我国经济快速发展过程中占有重要地位。在焊接过程中,运用电弧声信号对焊接状态进行实时监测,是实现智能化焊接的有效途径。因此,本课题提出了管道全位置电弧声的焊接状态监测的方法。首先,阐述了建立焊接状态系统的总体要求,规划了技术路线,设计了焊接状态监测系统硬件平台及软件界面。该系统由电弧声采集系统、运动控制系统及上位机软件组成,电弧声采集系统能够实现对电弧声信号的采
学位
焊接在石油化工领域发挥着重要作用,电弧焊接过程存在复杂的物理信息,其中熔池的动态行为直接影响焊缝成形,也决定了焊接过程的稳定性和焊接质量的优劣,但昂贵专业的熔池相机不利于施工现场推广。因此,本课题以全位置管道为研究对象进行焊接熔池动态行为检测,研究焊接偏差与熔池特征的关系,实时检测熔池表面形态,建立神经网络预测焊缝质量,以及熔池的动态跟踪,旨在优化焊接工艺、提高焊接质量以及降低人工作业负荷。首先,
学位
目前,高强度钢板在汽车行业上发展迅猛,但冲压成形时往往会出现起皱、破裂和回弹等问题。基于上述冲压成形过程中出现的一系列问题,本文选用DP780高强钢作为研究对象,在室温下通过静态拉伸试验获得了其基本力学性能参数。主要研究内容如下:(1)确定GTN模型的损伤参数,分析了3个主要损伤参数取值对成形极限曲线的影响,确定损伤参数后利用ABAQUS软件进行了数值模拟,获得了成形极限曲线,其中还得到了DP78
学位
在透明钢化玻璃生产、质检过程中,缺陷分析尤为重要,市场需求潜力巨大。随着图像处理技术的不断提高和FPGA在图像处理领域的快速发展,目前,光学测量仪器设备公司的研发大多采用FPGA方案,以满足工业级图像采样帧率和图像处理帧率的需求。本文基于FPGA在钢化玻璃表面缺陷检测,探究了加速SIFT(尺度不变特征变换)算法设计与实验研究,以钢化玻璃的缺陷检测为应用背景,提出了加速SIFT算法作为图像处理与特征
学位
近年来,金属卤化物钙钛矿材料由于制备工艺简单、发射可调谐、高光学吸收系数和电荷迁移率高等特点而备受关注。但是铅毒性和结构不稳定性问题阻碍了这类材料的发展,因此开发新型无铅金属卤化物材料具有重要的意义。铜元素具有储量丰富、环境友好、成本低廉等特点。此外,亚铜离子半径小,更容易形成低维结构。值得一提的是,低电子维度无机亚铜金属卤化物(Cu(I)MHs)继承了钙钛矿优良的发光特性并降低了毒性。它们的发光
学位
在科技高速发展的现在,超声波因其具有良好的方向性、穿透性和抗干扰能力,受到了研究人员的广泛关注。超声波技术应用的关键就在于超声波传感器,它是利用压电元件的超声波特性制造出来的发射和接收超声波的器件。传感器压电元件与检测目标之间存在一定的声阻抗失配,这会导致传感器内的混响、自发热、低信噪比和信号失真等现象的发生。因此,为了提高超声传感器的性能,需在器件中增加匹配层来减小声学失配,通过有效声阻抗过渡来
学位
轮毂电机因其在电动汽车上布局紧凑、动力传输效率高、易于实现四轮驱动控制等优点,逐渐成为电动汽车行业未来发展的重要方向。永磁同步电机以其能效高、无励磁损耗等优点成为国内车载电机的首选。然而,轮毂电机在运行过程中受随机路面激励影响造成的轮胎跳动,容易引起电机定转子不对称,导致电机产生气隙偏心加剧电磁振动,最终影响电机稳定运行和驾乘舒适性。工程上采用传统比例积分控制方法来抑制不确定性扰动,虽然实现简单但
学位
永磁同步电机(Permanent Magnet Synchronous Motor,PMSM)作为驱动电机在电动汽车、轨道交通等相关领域得到广泛应用。在驱动电机控制系统中无速度传感器技术运用越来越普遍。而常见观测器无速度传感器存在抖振、计算量大、控制精度低和对电机参数敏感等问题。良好的观测器可以保证电机运行安全可靠和高效稳定,但电机受自身额定电流及逆变器输出的最大电压的影响,速度范围受到一定限制,
学位
在能源紧缺和环境污染的背景下,大力发展新能源汽车成为我国汽车行业应对危机的有效途径之一,燃料电池汽车凭借排放无污染、高效节能广受青睐。燃料电池汽车通常采用复合电源供能,如何制定高效且能适应不同行驶工况的能量管理策略成为研究的重点。本文以燃料电池汽车为研究对象,开展工况自适应能量管理策略的研究,主要内容如下:首先,分析燃料电池汽车动力系统的构型,确定本文研究对象的具体结构,对其主要部件进行理论计算和
学位
焊缝识别跟踪技术是未来焊接机器人的重要发展方向之一,对于焊接机器人的自动化和智能化具有重要的推动作用。为此,本文对焊缝跟踪技术进行了相关理论与实验方面的研究工作。主要内容包括:首先介绍了国内外焊接机器人与焊缝跟踪的发展现状及趋势、课题背景和意义;然后针对焊接机器人在实际应用过程中遇到的问题,分析了影响其焊缝特征提取的因素并设计相应解决方案;接着重点阐述了基于卷积神经网络的图像分割算法,设计了一套机
学位