麦克风阵列的语音增强算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:ceylong2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生活中以语音为主要交互方式的电子产品越来越多,例如:智能音箱、智能机器人等。这给人们的生活添加了更多的“智慧”与“乐趣”。但目前在国内外市场上正在推广使用的各类“智能语音”应用产品都普遍存在噪声干扰环境下语音识别准确率降低的问题。因此,需要利用语音增强技术对语音信号进行降噪处理,提高识别的准确率。本文通过对相关技术的研究,改进并实现了一套基于麦克风阵列的语音增强算法。首先,对麦克风阵列技术进行了阐述,并对当前语音增强技术中面临的主要问题进行了总结。其次,分别对麦克风阵列语音信号的预处理、端点检测(VAD)、声源定位(DOA)几个模块的算法进行了研究。本文采用“基于多窗谱估计谱减法和能熵比法”的复合端点检测算法解决了低信噪比环境下利用单参数进行VAD会出现“漏音”检测的问题。在声源定位模块,利用信号和噪声频带能量差异特点,改进了一种DOA方法。此方法是基于波束指向性方法的理论,给信噪比(SNR)较高的频带部分加优化的权重因子后进行定位。测试表明,这种算法可以有效的减少噪声频带的影响,提高声源定位角度的准确性。然后,主要对线性约束最小方差(LCMV)、广义旁瓣相消(GSC)、最小方差无失真响应(MVDR)几种自适应波束形成算法进行了理论分析。以MVDR算法为理论基础,利用散射噪声场矩阵代替MVDR算法中的噪声协方差矩阵实现了一种超指向性波束形成方法的改进和优化,并进行了仿真测试和结果分析。测试结果表明此方法可以使阵列输出信号的增益更大,形成的信号波束具有更好的指向性,对实际的语音信号具有较好的增强效果。最后,针对算法硬件应用平台设计和主要实现流程进行了描述。主要对信号采集中使用的麦克风阵列电路及特点进行了分析。然后,在本文整套增强算法的基础上,对采集到不同声源角度的语音信号数据进行了仿真测试和多角度结果分析。本文通过对语音信号噪声环境的特性研究和分析,有针对性的对声源定位、波束形成等主要语音增强算法进行了改进和优化。测试结果表明,改进后的算法达到了预期设计目标,对实际的语音环境有一定的抗噪和抗干扰能力,鲁棒性有所提高,具有一定的实用价值。
其他文献
社会协同是宪政实践的一项重要内容,宪政视野下的社会协同具有治理、价值、技术、过程等不同内涵,它是指政府与各类社会组织之间的分工、协作的治理模式。社会协同与城市基层
随着当前时代的不断发展,以及信息技术的不断进步,电子商务的发展十分迅速,并且当前的经济进一步全球化,因此跨境电商也就随着经济进一步发展的过程萌生了出来。跨境电商是通
以溶有离子液体的超临界CO2作为电化学反应介质,研究在此介质中的电化学反应,结合离子液体、超临界流体以及电化学反应的优势,拓宽电化学反应的研究和应用领域,克服在传统电
20世纪末,流浪未成年人问题就已经成为一个普遍的社会问题。作为改革发展中的中国,流浪未成年人问题一直受到各级政府和社会各界的高度关注。据民政部2006年进行的一项研究估
人口快速老龄化背景下,养老形势日益严峻,居家养老服务保障模式应运而生。本研究基于对保定市老年人居家养老服务需求的调查,从居家养老服务提供者、服务项目、服务人员以及
通过田间试验,探讨以石灰、粉煤灰、白云石、废菌棒和化肥构成的不同组合改良剂对土壤微生物数量、酶活性和烤烟产量的影响。结果表明施用不同组合改良剂后,耕层土壤细菌、放
目的了解佛山地区居民血尿酸水平和高尿酸血症与相关疾病的发生情况。方法对13324例健康体检者的血尿酸水平及血肌酐、尿素氮、胆固醇、甘油三酯、血糖和血压的测定结果进行
随着经济社会的发展,生产、生活用水与湿地生态用水之间的竞争日益激烈,全球范围内的湿地遭受了严重破坏,变化环境下湿地生态系统保护和恢复成为了当前人们关注的焦点问题。本文
目的探讨鼻中隔偏曲与慢性鼻-鼻窦炎之间的关系。方法回顾性分析2015年12月~2018年10月期间在我院接受治疗的120例鼻中隔偏曲患者临床资料,依据《慢性鼻-鼻窦炎诊断和治疗指
玉米秸秆是丰富、优良的生物质资源和天然纤维原料。木质纤维生物质有机酸制浆过程是极具发展前景的生物炼制过程。开发有机酸玉米秸秆皮生物炼制浆(OABCSRP)短流程漂白技术具