论文部分内容阅读
对大多数有听力损失的患者来说,佩戴助听器是有效改善听力的办法之一。我国数字助听器市场90%以上是国外品牌,打造具有核心技术的国产数字助听器具有现实意义。 虽然数字助听器中包含一系列复杂的算法,如放大压缩,语音增强,回声消除等等,但是研究表明,算法的调用和参数的设置与用户所处的环境息息相关。而目前一般的解决方法是将多个针对不同环境的聆听程序预先存储在助听器内部,通过手动调节机身按钮或远程控制进行切换。但是这样做有以下问题:1)使周围人群意识到用户佩戴助听器,对部分用户造成精神压力;2)用户需要判断当前环境最接近哪个预设情景,并及时进行切换,增加用户的负担;3)对于一些特殊人群,如老人、儿童、甚至有其他身体残疾的人群,手动操作是不现实的。因此,迫切需要助听器能够自动判断当前所处环境,并自动调用最优设置,使得目前助听器的一些高级信号处理方法能有效的帮助听力受损者。 论文的主要内容有以下4个方面: 1)特征提取 总结用于声音分类及相关领域的特征及其理论依据,并做出优化改进,利用统计学原理分析特征在预设类别下的分布。结果表明三个幅度调制特下,纯净语音和噪声两个类别的概率分布峰值尖锐,重叠较小,较容易区分。倒谱系数和倒谱系数的差分特征下,纯净语音和音乐的分布与其他类别分布之间的差异较大,容易区分。谱熵信息特征下,各类别有明显的峰值,且峰值之间重叠较小。但是完全区分五类信号无法仅使用单一特征,需要利用多维特征的联合表示五类声场景的差异。 2)特征选择 受数字助听器计算量和存储空间的限制,需要从多维特征空间中进行降维选择。本文从互信息的角度分析原始特征集,研究经典的基于互信息的特征选择方法,提出一种最大互信息的特征选择方法。利用特征与类别之间,特征与特征之间,以及类别条件下特征之间的互信息评估原始特征,选择特征子集。声音分类实验验证特征选择的效果,利用12维特征可以达到90%的正确率。与其他特征选择算法比较,最大互信息的特征选择方法的分类正确率平均提高6.9%,特征平均减少2.44个。 3)特征转换 为了进一步降低计算量,优化声音分类方法,提出一种基于互信息的主成分分析方法将12维特征线性转换到主成分空间再次进行降维。方法引入类别信息,并以类别条件下特征之间的互信息之和来计算主成分,避免传统方法忽略类别信息以及方差最大化原则带来的不良影响。声音分类实验表明,经过PCAMI转换后的平均分类正确率最多提高11%,原始12维特征经过PCAMI转换后,仅需3维主成分就可以达到86%的分类正确率,达到90%的正确率也仅需要8维主成分。 4)分类器设计与学习算法 以多层感知器网络为分类器,为了提高声音分类的训练速度和分类精度,提出一种改进的粒子群优化算法用于网络训练。该方法以期提高粒子的多样性,初始化当前种群内的部分最优粒子的速度,增加粒子搜寻范围,使得算法更有可能逼近全局最优解。利用标准测试函数测试,结果表明,IPSO比PSO算法找到的最优值更接近于全局最优点,且算法更加稳定。利用声音分类实验评估IPSO算法的分类均方误差以及收敛速度,结果表明IPSO算法较之BP和PSO算法的均方误差分类均方误差约降低3%,且收敛速度提高,平均减少18次迭代,提高了助听器声音分类算法的学习效率。