基于卷积神经网络的歌唱语音识别

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:angelboy8100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用信号分析手段对歌唱艺术嗓音的质量和状态进行科学客观评价,这样对歌唱表演人才的科学选拔、教学、培训以及嗓音疾病诊断等方面有着重要的意义。然而,目前相关方法还存在着较多问题亟待解决,如声学参数研究单一、信息融合效率低、算法鲁棒性不好、低信噪比情况下识别准确率低、评价阶段信息利用不充分等。针对以上问题,本文采用卷积神经网络(Convolutional Neural Network,CNN)作为基础网络,通过相关预处理以及对CNN网络的参数优化和结构调整,将传统二维CNN(2DCNN)网络改进为更适用于一维声音信号的一维CNN(1DCNN)网络,提出了基于1DCNN网络的歌唱艺术嗓音质量评价方法。首先,对嗓音信号进行预处理。利用语音分析技术提取歌声声学参数第一共振峰、第三共振峰、基频、音域、基频微扰、第一共振峰微扰、第三共振峰微扰、平均能量等,将这些基础特征进行融合重组构成输入信号。本文采用小波分解重构低频系数信号,结合高阶累积量思想对重构的带噪嗓音信号进行检测分析,提出了一种基于改进小波变换的基音周期检测方法。实验证明,本文所提方法可以提高低信噪比下基音周期检测的准确性,且计算量较小,声音信号的频谱结构和信息保留完整。然后,提出了改进的适用于一维声音信号的1DCNN模型。通过改进和调整传统2DCNN的结构,提出了一种能更好地描述一维嗓音信号的时变特性的1DCNN模型。针对CNN训练过程中耗时较长的问题,本文通过融合分数阶神经网络思想,提出了利用Sigmoid函数分数阶处理节点的方法,同时提出了改进的0.5分数阶1DCNN模型。实验证明,本文所提模型收敛速度更快,缩短了CNN训练耗时,且嗓音质量评价系统精度为85.7%,相较于传统2DCNN网络提升了5.4%。最后,提出了一种基于1DCNN模型的歌唱艺术嗓音质量评价方法。在Matlab R2016a平台完成仿真实验,将预测评价结果与专业人士的主观评价结果进行比较,得出误差统计结果;并与BP(Back Propagation)神经网络、小波神经网络以及传统2DCNN网络进行对比分析。实验结果表明,本文所提方法平均误差为0.23,比BP神经网络低0.50,比小波神经网络低0.33。本文所提基于1DCNN的歌唱艺术嗓音质量评价方法较好地解决了特征信息融合以及利用率、低信噪比下基音周期检测、一维卷积神经网络的构造以及训练效率等问题,能够客观有效地评估歌唱艺术嗓音质量等级,对比误差小,鲁棒性较好且可移植性强。本文方法不仅可用于歌唱嗓音评估,还可用于嗓音疾病诊断等方面,具有较大的应用价值。
其他文献
在云环境下,通常需要处理大量的计算任务,云平台中的任务调度策略直接关系到云计算系统的运算性能,而Hadoop计算框架以可靠、容错的方式可以在大型集群上并行处理大量数据,YA
水利水电工程移民安置是一项艰巨而复杂的社会系统重建工程。为了保证水利水电工程移民项目的顺利实施,必须加强对移民安置的监督管理。《大中型水利水电工程建设征地补偿和
面对高速干式切削加工对刀具涂层的严格要求,本文致力于优化提高AlCrN基硬质涂层的力学性能、抗氧化性能和耐磨损性能。首先,采用高功率脉冲磁控溅射技术(High Power Impulse
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
本文针对工程在施工中的进度控制,主要论述施工进度计划的编制依据、内容、实施、调整、总结等方面的内容。
叙事的本质是信息交流,展示设计作为一种叙事性的物质载体,需要以情节为线索,把散碎的原始信息、资料整合后,组成一条或几条线索以形成一个有机的叙述框架。在博物馆展示设计
随着互联网及移动信息技术的发展,电子商务模式加快了全球企业间的往来,有效地提升了企业参与市场交易的效率。依靠先进信息技术提供专业化信息服务的电子商务平台企业,具备
自我意识,就是一个人对自己的认识和评价。处于少年时期的初中学生,能否对自己作出正确的认识和评价,这对于个性的形成和发展,有着重要影响。从小学到初中,学生的自我意识经历了一
推行建筑产业现代化、发展装配式建筑,是转变建筑生产方式,推进产业转型升级,实现可持续发展的重要举措。随着装配式建筑的进一步推广,混凝土预制构件的产品质量成为大家关注