数字助听器声信号处理关键算法研究

来源 :东南大学 | 被引量 : 4次 | 上传用户:jicck321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着老龄化社会的到来,老龄听损患者的数量持续增加。听损对老年人精神上造成的困扰仅次于位居第一的消化系统疾病,长期患有老年性听损会严重影响老年人的身心健康并降低其生活质量。对于轻度、中度甚至重度感音性听损患者来说,配戴助听器是最有效的听力干预和康复手段。近一个世纪以来,助听器技术取得了长足进步,用户对助听器的满意度从1980年的59.6%上升至2008年的74.0%。但是,现有助听器的性能因受到啸叫、信号畸变以及噪声的影响而难以提高。部分患者已经验配了助听器,但是没有佩戴,其中一个重要的原因就是助听器不能提供足够的益处。因此,面向听损患者的数字助听器技术亟需进一步研究。本文从响度补偿、自适应声反馈抑制、非线性频率压缩算法和语音可懂度增强等方面对汉语数字助听器的几种关键技术进行了研究,主要研究内容如下:1、论文提出了一种自适应响度补偿方法,用于缓解传统的响度补偿算法中信号可听和畸变之间的矛盾。首先,利用gammatone滤波器组对信号进行多通道分解来模拟人耳听觉特性;然后,根据患者的听觉动态范围和通道信号的声压级来确定补偿方法。若采用非线性补偿方法,则在补偿过程中使用自适应宽动态范围压缩(Wide Dynamic Range Compression,WDRC)技术,该技术根据患者的听觉范围和输出信号的声压级自适应地调整压缩比,使其尽量接近于1。自适应调整压缩比的目的是在信号可听的前提下,减小信号的畸变。并且,自适应WDRC技术可以提高噪声环境下的输出信噪比(Signalto Noise Ratio,SNR)。实验结果表明,与WDRC补偿方法相比,所提方法在语噪声环境下提高了输出SNR;与线性和WDRC补偿方法相比,提出的方法提高了语音可懂度和语音质量。2、论文提出了一种应用于助听器声反馈抑制的变步长算法,用于缓解自适应滤波算法在快收敛速度和低失调量之间的矛盾。算法根据自适应滤波器系数归一化的短时平均和长时平均之间的距离,将滤波器的更新状态分为收敛状态、过渡状态和稳定状态,并在不同的自适应状态下使用不同的步长。在收敛状态使用大步长保证收敛速度;在过渡状态使用阶梯状步长,以进一步降低失调量;在稳定状态使用小步长,以保证系统收敛至稳态解。该变步长算法分别被应用于归一化的最小均方误差(Normalized Least Mean Error,NLMS)自适应滤波器和归一化的子带自适应滤波器(Normalized Sub-band Adaptive Filter,NSAF)算法,形成了变步长 NLMS(Variable Step Size NLMS,VSS-NLMS)和变步长NSAF(Variable Step Siz eNSAF,VSS-NSAF)算法。实验结果表明,本文提出的算法具有收敛速度快,稳态失调量低,输出语音的语音感知质量(Perceptual Evaluation of Speech Quality,PESQ)评价值高等特点。3、论文提出了一种自适应非线性频率压缩算法,以充分利用听损患者残余的可听频带,提高高频听损患者的语音可懂度。首先,对高于截止频率的信号按照BARK尺度进行临界带分割;其次,根据患者的截止频率和最大可听频率确定全局压缩比;再次,根据全局压缩比和子带信号归一化的平均能量自适应地确定子带压缩比,从而确定子带信号压缩后的频带范围;最后,通过映射的方法将高频信号压缩至低频,使得高频不可听的信号变得可听。语音可懂度实验结果表明,与WDRC算法和非线性频率压缩算法相比,本文提出的算法可显著提高声母以及不同信噪比条件下句子的可懂度。4、论文提出了一种新的语音特征——多分辨率功率归一化倒谱系数(Multi-Resolution Power Normalized Cepstram Coefficients,MRPNCC)特征来获取语音的局部信息和上下文信息。并且,基于MRPNCC特征,提出了一种语音可懂度增强算法,以提高听损患者的语音可懂度。首先,利用MRPNCC特征向量训练支撑矢量机(Support Vector Machine,SVM)模型;其次,利用训练好的模型对语音的时频单元进行分类,移除以噪声为主导的时频单元,保留以语音为主导的时频单元,并使用维纳滤波器对其进行去噪;最后,将滤波后的时频信号重构得到增强的语音。实验结果表明,MRPNCC特征优于传统的谱特征,而且语音可懂度实验结果表明,所提出的语音可懂度增强算法可以显著提高听损患者的语音可懂度。
其他文献
目的:了解脑出血患者在出血后脑组织中是否有Nogo-A基因的表达及相关性。方法:选择高血压脑出血开颅患者的脑组织30例为试验组,并选择同期相对正常的脑组织作为正常组。两组进
鼻咽癌(nasopharyngeal carcinoma,NPC)是一种上皮细胞的恶性肿瘤。我国是世界上鼻咽癌发病率和死亡率水平较高的国家之一。由于鼻咽癌是一种低分化、高转移性恶性肿瘤,其治
<正>一日,批阅学生周记,读到这样一段文字:"老师,您不要生气,平时我们都很喜欢您上的课,您走了一段时间去学习,我们都很想念您。但这个学期,天天学习《论语》、《孟子》,很是
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
第一部分HMGA2在鼻咽癌中的表达及临床意义目的:比较HMGA2在鼻咽癌组织及鼻咽慢性炎组织中的差异,分析HMGA2与临床病理因素及预后的关系。方法:1.采用实时荧光定量PCR法检测72
本文分别用化学热力学及燃烧反应动力学理论对高炉喷吹煤水浆的两个主要限制因素,即高炉风口回旋区绝热火焰温度的降低及煤水浆的燃尽率进行了计算,得到了在一定鼓风温度及湿
目的:对激光光凝治疗视网膜静脉阻塞的临床疗效进行评价。方法:选取进行视网膜静脉阻塞的患者120例为研究对象,将其随机分别为激光治疗组(行激光光凝治疗)和非激光治疗组(采取传统
本文主要研究采用吉林省特有的北冰红山葡萄采进行冰酒发酵工艺的研究,在发酵工艺研究过程中,通过单因素试验以及正交试验,确定了其最佳发酵温度为12℃,酵母添加量为0.12%,SO2添加量
本文提出了连续加热炉钢温最优控制模型,其实质是离线确定钢坯最佳升温曲线并实现在线最优控制。模拟运行表明,模型具有良好的控制效果,可用于加热炉计算机控制系统中。