论文部分内容阅读
嗓音与人们的生活质量和幸福指数息息相关,如何对嗓音病变患者的嗓音进行较好的检测与分类、判断病变程度、以及评价治疗效果显得极为重要。病态嗓音检测与分类的实质是将采集的嗓音样本转化为数字信号,提取其特征参数,并将提取的特征参数采用识别机识别出该测试样本所属类别,由此达到疾病检测与诊断的目的。其中,特征提取是病态嗓音识别中的关键技术。如何更有效的提取病态嗓音特征,提升病态嗓音分类精度,一直是相关工作关注的焦点。本文主要对病态嗓音特征提取技术进行了相关研究,主要包括如下两个方面内容:1、为了尝试将嗓音信号进行随机成分和确定性成分的分离,研究分离后得到的随机信号和确定信号的病理嗓音特性。本文首先对分离方法进行研究,对于Ricardo和Rodrigo提出的基于经验模式分解(EMD)和互信息(MI)分离信号中随机成分和确定性成分的方法,通过对两个仿真信号和两个嗓音信号的实验验证了该方法的可行性。但是,由于分离过程中容易产生模式混叠效应,为解决这个问题,考虑将集合经验模式分解(EEMD)方法代替EMD方法进行随机成分和确定性成分的分离。通过对比发现EEMD方法的分离效果更好,且更有利于病态嗓音信号实际应用中的分离。另外,提出了“以最大阶跃方式分离”判决分界点的方法,实现了对正常及病态嗓音样本的有效与批量处理。2、将EEMD和MI法应用到正常及病态嗓音信号的随机成分和确定性成分分离,得到随机信号和确定信号,并分别对这两类信号提取传统声学特征和非线性特征进行识别。由其组合特征的识别结果可知,嗓音信号的病理特征主要存在于随机成分中。另外,通过分析嗓音产生机理可知,嗓音病变主要与声带振动异常有关。由此,提出将此分离方法应用于声带激励信号,以突出嗓音信号的非线性动力学成分。由声带激励信号中的随机信号提取的计盒维数得到了单特征最高识别率:平均识别率94.27%,最高识别率98.67%。最后,通过此随机信号提取的2阶Renyi熵、模糊熵和计盒维数三个非线性特征组合,得到最佳识别率:平均识别率95.19%,最高识别率100%。说明该分离出随机信号的方法,能在声带激励信号的基础上,进一步突出病态嗓音信号的非线性动力学特性,从而提高病态嗓音的识别率。