论文部分内容阅读
听觉信息处理是生物感知外环境信息的重要过程,同时也是生物与外环境进行信息交互的重要途径之一,具有高度多学科交叉属性。随着现今仿生科学、信息技术等迅猛发展,听觉信息处理研究成果在机器人的人机交互、信息感知和识别、以及导航定位等诸多领域都具有广泛的应用。当前,研究人员主要通过建立听觉感受器模型研究听觉信息处理过程,并获得了贴近听觉生理特性的听觉信息处理结果。但由于所建立的听觉感受器模型架构较大、推导和计算过程复杂,常常在听觉仿生应用中受到限制,这迫使研究人员直接着眼于听觉感受器处理信息过程中的核心机制,通过模拟耳蜗内基底膜功能提出了基底膜模型。该模型具有相对简单的实现形式,但忽略了听觉感受器内其它结构的功能,使得它对听觉生理特性的模拟始终存在不足。因此,为获得简单易实现的听觉信息处理方法,也为获得更贴近生物听觉生理特性的听觉信息处理结果,研究人员不断在生物感知和处理信息的机制中寻求新的研究途径。本文深入分析听觉机理,并着眼于生物神经元滤波机制,将生物对外环境信息进行处理的过程归纳为“感受器感知——神经元滤波”过程。在此基础上,以“听觉感受器——神经元”为研究对象,从宏观信息流向和微观处理机制完整模拟听觉信息处理过程,并利用听神经信息保持机理,将听觉感受器对信息的处理转换为神经元对听觉信息的响应。着眼于信息在听觉感受器与神经元内的信息传递形式,采用振动学方法建立和提出听觉感受器模型、神经元滤波模型,并提出一种具有良好听觉响应一致性、且具有简单实现形式的听觉信息处理方法。本文具体研究内容主要包括以下几个方面:通过对听觉信息处理机制的分析,结合听觉感受器生理结构,建立耳蜗感知模型的三维结构。采用振动学等效分析和保形映射方法,模拟并研究耳蜗内部流体环境中基底膜振动、以及流体对基底膜振动的耦合作用。采用剖面法,模拟并研究耳蜗内微观力学特性,包括外毛细胞主动作用力、以及基底膜与盖膜的耦合关系。在此基础上,提出基于振动理论和听觉机理的耳蜗感知模型。在仿真平台上进行实验,并与听觉生理学数据进行比较,验证了该模型能够实现耳蜗具有的频率分布位置特性、非线性放大功能、以及高听敏度能力。深入分析振动理论用于模拟神经信息传递的可行性。进行神经元滤波机制分析。通过改进FHN神经元模型,从振动学角度建立基于膜电势增量变化的神经元模型。将神经元滤波机制引入基于膜电势增量变化的神经元模型,提出一种基于振动理论的神经元滤波模型。分别研究该神经元滤波模型的参数特性、稳定参数条件和参数选择策略。通过仿真实验、硬件测试和比较分析,对此神经元滤波模型的有效性、适用性、客观去噪性能以及实时性进行了验证。通过分析“听觉感受器——神经元”宏观信息流向,结合已提出的耳蜗感知模型和神经元滤波模型,研究耳蜗感知信息与神经元滤波响应的相关性条件,实现耳蜗感知模型与神经元滤波模型的对接。在此基础上,提出基于耳蜗感知与神经元滤波的听觉信息处理方法。分别研究该方法的稳定参数条件、参数选择策略、参数计算方程和参数确定流程。通过仿真实验,分别从非线性放大、频域响应、以及时域响应进行听觉响应一致性研究和验证。通过与当前具有代表性的基底膜模型建立方法比较,进行该方法的性能评估。对本文提出的耳蜗感知模型进行面向多音同时感知的实验研究,通过听觉掩蔽实验,研究并分析多音同时感知时该模型的听觉响应特性。对本文提出的听觉信息处理方法进行实验研究,分别采用该方法进行声音激励、语音复现、声音增强、语音特征提取和说话人识别。获得了符合耳蜗分频特性的纯音与复合音响应。实现了对语音的频谱复现,并获得了符合耳蜗非线性放大特性的语音频谱。同时增强了低信噪比环境下声音的客观去噪性能评价指标和主观听觉感受。提取出了对说话人识别更有效、对语音高频信息更敏锐的语音特征参数。通过无噪声和含噪声的说话人识别实验和分析,获得了更好的识别效果。