论文部分内容阅读
采用信号分析手段对歌唱艺术嗓音的质量和状态进行科学客观评价,这样对歌唱表演人才的科学选拔、教学、培训以及嗓音疾病诊断等方面有着重要的意义。然而,目前相关方法还存在着较多问题亟待解决,如声学参数研究单一、信息融合效率低、算法鲁棒性不好、低信噪比情况下识别准确率低、评价阶段信息利用不充分等。针对以上问题,本文采用卷积神经网络(Convolutional Neural Network,CNN)作为基础网络,通过相关预处理以及对CNN网络的参数优化和结构调整,将传统二维CNN(2DCNN)网络改进为更适用于一维声音信号的一维CNN(1DCNN)网络,提出了基于1DCNN网络的歌唱艺术嗓音质量评价方法。首先,对嗓音信号进行预处理。利用语音分析技术提取歌声声学参数第一共振峰、第三共振峰、基频、音域、基频微扰、第一共振峰微扰、第三共振峰微扰、平均能量等,将这些基础特征进行融合重组构成输入信号。本文采用小波分解重构低频系数信号,结合高阶累积量思想对重构的带噪嗓音信号进行检测分析,提出了一种基于改进小波变换的基音周期检测方法。实验证明,本文所提方法可以提高低信噪比下基音周期检测的准确性,且计算量较小,声音信号的频谱结构和信息保留完整。然后,提出了改进的适用于一维声音信号的1DCNN模型。通过改进和调整传统2DCNN的结构,提出了一种能更好地描述一维嗓音信号的时变特性的1DCNN模型。针对CNN训练过程中耗时较长的问题,本文通过融合分数阶神经网络思想,提出了利用Sigmoid函数分数阶处理节点的方法,同时提出了改进的0.5分数阶1DCNN模型。实验证明,本文所提模型收敛速度更快,缩短了CNN训练耗时,且嗓音质量评价系统精度为85.7%,相较于传统2DCNN网络提升了5.4%。最后,提出了一种基于1DCNN模型的歌唱艺术嗓音质量评价方法。在Matlab R2016a平台完成仿真实验,将预测评价结果与专业人士的主观评价结果进行比较,得出误差统计结果;并与BP(Back Propagation)神经网络、小波神经网络以及传统2DCNN网络进行对比分析。实验结果表明,本文所提方法平均误差为0.23,比BP神经网络低0.50,比小波神经网络低0.33。本文所提基于1DCNN的歌唱艺术嗓音质量评价方法较好地解决了特征信息融合以及利用率、低信噪比下基音周期检测、一维卷积神经网络的构造以及训练效率等问题,能够客观有效地评估歌唱艺术嗓音质量等级,对比误差小,鲁棒性较好且可移植性强。本文方法不仅可用于歌唱嗓音评估,还可用于嗓音疾病诊断等方面,具有较大的应用价值。