基于麦克风阵列的声源定位系统的算法研究与硬件实现

被引量 : 1次 | 上传用户:liyon_88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的不断进步,人们对人机交互的需求日益增加,人机交互技术无论是在科学研究领域还是市场应用领域都得到了蓬勃发展。人机交互的交流方式也从必须具备相应的专业素质进行语言编程控制逐步发展到了普通人也能进行的语音控制。而人机交互能进行语音控制的基础是计算机能准确的接收到控制者发出的语音信号,这就要求计算机首先对目标声源进行声源定位。目前,基于麦克风阵列的声源定位算法研究已成为了阵列信号技术领域的一个新兴热点。然而,国内对该类算法的研究起步较晚、发展水平有限且能应用于市场的产品还很少,针对这种情况,本课题做了如下研究工作:1、在系统研究相位转换-广义互相关(PHAT-GCC, Phase Transform-Generalized Cross Correlation)时延估计算法基本原理并进一步分析分析其结构特点和适用范围的基础上,结合设计要求和实际条件,提出了改进的PHAT-GCC时延估计算法。改进的PHAT-GCC时延估计算法在结构上增加了端点检测和信噪比估计两个模块,端点检测模块判断当前信号的类型,避免对无声的信号段的处理,大大降低了算法的运算量,提高了硬件的运行效率;信噪比估计模块根据当前语音信号的信噪比变化跟随修改加权函数参数,对声场环境中信噪比不同的语音信号采用具有针对性的加权函数,锐化互相关函数峰值,提高时延估计精度。2、基于红色飓风E45开发板为硬件平台,设计了基于麦克风阵列的实时声源定位系统。针对直线阵麦克风阵列和平面阵麦克风阵列无法确定声源的空间位置问题,提出了具有全空域定位能力的空间六元麦克风阵列拓扑结构;算法实现部分使用模块化设计,利用SPARTAN6系列FPGA XC6SLX45内部丰富的逻辑资源和强大的数字信号处理能力,声源定位系统每次定位耗时仅为5.3ms,满足声源定位系统的实时性要求。3、实验验证所设计系统硬件状况运行良好。针对不同的声场环境和声源类型,进行对比测试,测试结果表明改进的PHAT-GCC时延估计算法的定位成功率比PHAT-GCC时延估计算法的定位成功率要高出20%左右,满足了课题设计的要求。
其他文献
明清桐城地区较大的方氏家族有“桂林方”、“鲁谼方”、“会宫方”三支。但是人们提到桐城方氏,往往指的是桐城桂林方氏家族。方氏在科举功名上成就巨大是其被称为“桂林方”
文章以辽宁各工业旅游示范点为例.从工业旅游产品模式的理论认识研究出发.介绍了工业旅游产品及工业旅游产品模式的概念及特点;其次分析了辽宁工业旅游发展的背景环境,通过对辽宁
基于红外目标模拟器动态校准系统的应用场景,分析了动态校准系统光学系统的设计特点,指出光学系统应选择折反式二次成像光路结构。基于经典的光学系统无热化原理,以光机材料
自1949年新中国成立后,我国照搬苏联的模式,对高校实行中央集权制管理体制。高校的级别不是按照教育质量的好坏、科研成果的优劣、学术水平的高低和社会影响力的大小等标准来
硝酸酯类药物具有扩张血管、抑制血小板聚集和黏附以及抗血栓形成的作用。临床上硝酸酯类药物常用于冠状动脉粥样硬化所引起的心绞痛治疗。在硝酸酯类药物使用方面,大多数患
进入21世纪以来,中国社会人口老龄化的问题日趋严峻,60岁以上老年人人口数量的快速增长和当今社会居家养老压力的逐渐增强使得中国现今对养老建筑的需求愈发强烈。装配式建筑
近年来,一大批中小企业在财政、金融政策和资金的扶持下迅速发展壮大,成为推动区域经济和税收增长的重要力量。但中小企业成长过程中依然存在诸多制约因素,融资难问题尤其突出。
该文系统分析了“麦莎”台风期间黄浦江上游潮位变化规律,针对黄浦江上游出现历史最高潮位,而下游水位并不高的特点,从水利工程建设、水闸运行、上游来水、潮汐作用和降水等
土地资源是最为宝贵的自然资源,人类的生存和发展离不开土地。在人口日益增多、土地日益减少的今天,土地资源的保护已经受到世界各国的高度重视,并同时制定出一系列的法律法
辽宁奥克化学股份有限公司(以下简称奥克公司)是国内最大的、以环氧衍生新材料为主导,集产、学、研于一体化的上市公司。随着公司外部环境的变化以及公司战略的转移,现行的薪酬制