论文部分内容阅读
我国民族乐器共鸣构件的声学品质是评定乐器品质等级的关键因素,而木材是制作民族乐器共鸣构件的重要材料,故针对木材声学品质的研究对于乐器品质等级的评定具有重要的意义。而目前在乐器生产过程中,乐器共鸣构件的选择大都是凭靠技师的经验判断,这种方法具有耗时长、人力成本大和判断依据不足的缺点。针对此问题,本文选择有代表性的民族乐器琵琶为对象,研究用于制作共鸣构件(共鸣板、共鸣箱)木材的声学振动性能,提取可有效表征琵琶共鸣木质构件声学性能的特征参数,并建立相应的声学分类模型。目前声音识别和深度学习技术得到了快速发展,并且已经在声音和图像领域取得了巨大的进展,因此本文研究的重点是将深度学习及声音识别技术应用到琵琶板材的分级研究方面以实现智能化选材,该研究将对我国琵琶选材技术水平的提高起到积极的推动作用。首先,针对原始声音特征区分能力不足的问题,本文对木材声音信号的声谱图特征提取方法进行了改进研究。首先对木材声音信号进行预处理操作,然后将其转化为声谱图图像特征,为提高声谱图特征表达能力及细节信息,采用改进的限制对比度自适应直方图均衡化(CLAHE)方法对声谱图进行处理。通过色彩空间变换方式将声谱图转换到HSI空间,对I分量采用改进的CLAHE和双线性插值的方法进行增强处理得到增强声谱图。最后,为了验证增强声谱图特征的有效性,分别将梅尔频率倒谱系数(MFCC)及差分特征、原始声谱图特征和增强声谱图特征作为分类器的输入进行对比实验,证明了本文提取的增强声谱图特征在区分木材声音信号时具有更好的分类效果。其次,针对经典分类方法识别精度低的问题,本文对比了经典算法和深度学习模型的分类性能。其中,经典算法以高斯混合模型和支持向量机为基线系统,深度学习模型方面选择的是卷积神经网络(CNN)结构,并针对CNN模型参数选取困难的问题,提出了网格搜索和动态学习率相结合的方法加以解决。考虑到网络层的深度对结果影响大的问题,本文设置3种不同深度的CNN结构进行对比,对其中最佳深度的网络结构进行改进得到SMCNN。最后,为了进一步优化SMCNN模型,分析了将极限学习机(ELM)作为SMCNN分类器的优势和可行性,得到SMCNN-ELM混合模型。实验结果表明将ELM算法引入到卷积神经网络中,相比于单纯使用卷积神经网络模型可以有效的提升识别精度,并且可以解决训练时间过长的问题。综上所述,本文提出的方案以木材声音信号作为切入点,针对声音特征提取和分类算法两大方面进行了改进和优化,为琵琶板材分级研究及选材领域提供了一个可靠的思路。