盲声源分离技术应用研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:zbz963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我们生活在声音的世界里。在嘈杂的环境下,我们很难获得理想的声源,并且交谈会变得不容易。因此从带有噪声的观测信号中获得我们想得到的目标源声源信号,对于人与人或是人与机器的交流来说,都是相当重要的一件事情。因此盲声源分离在人们的日常生活中是很重要的技术应用。另外盲声源分离技术在人和机器之间的声源通信信道建构也得到广泛应用。盲声源分离(BSS)是一种仅仅使用每个通道观测信号信息的估计源声源信号的方法。我们事先并不需要知道源信号的信息,包括频率特性、源信号空间位置或是源信号是怎样混合的,就可以执行这个估计过程。本文分别研究了声源信号在超定情况下(m?n)卷积混合和欠定情况下(m?n)瞬时混合的盲信号分离问题。具体的研究工作如下:1.首先本文研究了系统是超定的情况下,即从m个卷积混合观测信号中分离出n个源信号。具体步骤为:开始将时域观测信号通过短时傅立叶变换(STFT)转化到时频域。然后利用FastICA分离算法在频域分离观测信号,最后通过频点对换、幅度解混、时频掩蔽和逆短时傅立叶变换一系列操作,我们最终就可以得到估计的源声源信号。2.另外本文研究了系统是欠定的情况下,即从m个瞬时混合观测信号中分离出n个源信号,本文的研究仅考虑了源信号传播过程中幅度衰减和时间延迟的情况,而没有考虑声音混响的情况。分离过程中主要利用了观测声源信号在频域的稀疏性。我们的分离算法是在2路观测信号和3路源信号的实验条件下完成的。具体过程可以分为三个阶段:首先,在频域通过势函数聚类观测信号的角度,将观测信号按它们所属的源进行划分,这时可以估计出衰减矩阵。其次,对于每个划分,通过补偿一个可变时移,我们重新聚类观测信号的角度,直到聚类再次出现,每个可变时移就是时延矩阵的一列,这样我们可以估计出了时延矩阵。最后,通过上面得到的衰减矩阵和时延矩阵,再加上信号频谱系数的幅度是符合拉普拉斯分布这个假设。在混合方程的限定下,我们求得最小的信号幅度和。这实际上是一个二次锥规划的问题。这样我们就估计出了源信号。
其他文献
宽带雷达在距离分辨力、目标参数测量精度、雷达的“四抗”性能、目标的识别性能、强杂波背景下弱目标的检测性能、信号的波形设计等方面相较于窄带雷达有明显的优势,是现代
星载SAR在实现高分辨成像、宽测绘带成像等方面具有广阔的前景,多个星载SAR组成的星座系统在地形数据获取、动目标检测等领域也有着深厚的潜力。因此,星载SAR受到了广泛关注,
能源互联网以可再生能源为主要一次能源,以可再生分布式能源+互联网为核心,实现可再生能源接入。随着国内越来越多的大规模风力发电站并入电网,电网运行和调度由于风力的间歇性
随着FPGA技术的发展,其应用领域也在不断扩大。科研工作者将FPGA用来处理雷达信号,由于雷达信号数据量大并且要求对信号处理实时完成,传统的DSP处理器已很难满足要求。由于FP
手语识别的研究有两个主要方面:孤立词和连续语句识别。孤立词识别的重点是用户执行的一个手势,并试图识别它。在连续识别中,用户需要一个接一个地执行手势,目标是识别用户执
行为识别是计算机视觉研究和应用中的一个重要方向。其目的就是设计一个能自动分析视频数据中的人体行为的智能系统。行为识别系统在视频监控、运动娱乐、人机交互等场合有大
本课题设计来源于教研室与广东省深圳市政府合作的“深圳市战略性新兴产业项目”,项目名称为移动通信和超高频射频识别一体化终端关键技术研究与产品开发。本课题工作内容是
随着计算机网络的进步,数据存储成为了一个蓬勃发展的研究领域和市场。由于其高性能,有效性,可扩展和易于资源共享的优势,存储区域网络(SAN)成为许多公司存储数据的首要方案
随着数据通信和多媒体业务的飞速发展,现有的移动通信系统已越来越不能满足人们的需求。因此,3GPP提出了3G的长期演进计划(Long Term Evolution,LTE),意在提供更高的传输速率
近年来,随着身份鉴定应用的增长,生物特征的研究成为一个非常流行的研究课题。生物特征识别技术与传统的识别技术相比更加可靠和安全。流行的生物识别方法利用人的生理特征比