非负稀疏信号分解及在单声道声音分离中的应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:asd137889706
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息时代里,随着语音识别技术的不断发展,让机器具有“听懂”人类语言能力的研究正在一步一步成为现实。携带着大量信息的语音信号本身是非常复杂的,并且具有非平稳性、时变性等特征。语音识别既是一个理论问题,也是一个工程问题。它综合了许多理论的研究成果,如声学、语音学、语言学、生理学、数字信号处理、信息工程、通信理论、电子技术、计算机科学、模式识别、人工智能等。在这篇文章开始的部分,我们介绍了声学的基础知识和人类声音感知的机理;接下来,我们给出了在时域处理和频域处理语音信号的一些经典的技术,比如短时平均能量分析、短时过零分析、短时自相关函数分析、快速傅立叶变换等;本文重点从理论和实验上讨论语音分离,特别是单声道语音分离的算法及其在分离音乐鼓点中应用。现实生活中的声音信号往往是由几个声源发出的声音混合而成的,语音分离就是从这种混合声音信号中把一个一个源声音信号分离出来。人的耳朵能从熙熙攘攘的声音中有效的捕捉到相对自己重要(感兴趣)的信息,即使是这些声音在频率上和时间上都配合得很“融洽”。但是要在计算机上实现人耳的这个能力是非常困难的,这就是计算机模拟人耳功能的盲信号分离问题(BSS),即要从混合在一起的声音信号中分离出一个或者多个感兴趣的声音信号出来,而事先我们对混合在一起的声源信号的情况是根本不知道的。传统的解决这个问题的方法是用多个麦克风,在不同的位置上得到这段混合的声音信号,以便获取足够的、相对独立的信息来分离出源声音信号。如果我们已经知道了声源信号之间相互独立,则可以用独立主元分析(ICA)来解决这个特定的盲信号分离问题。在这篇论文里,我们用了一种和ICA算法数字自适应技术很类似的带稀疏性条件限制的非负因子分解法(SNMF)来处理语音分离问题。SNMF算法作为一个分析和解决问题的工具,在很多应用场合已经证明了它的价值。这个算法的最大特点就是它分解出的矩阵具有稀疏的特点,能表现出事物的局部特征,并且直观性强,易于理解。
其他文献
计算网格资源具有分布性、异构性、动态性和自治性等特性,使得计算网格的运行环境与应用模式面临着很多的技术挑战,对任务的执行效率具有决定性影响的资源调度技术是其中之一
随着Internet技术和网络业务的飞速发展,计算机网络越来越普及,应用非常广泛,计算机网络逐步影响着人们的生活和工作方式,用户对网络业务性能的要求越来越高,网络性能的优劣
随着社会不断发展,政府信息化建设的重点已经从政府机关内部的办公自动化系统以及政府对外信息发布和反馈平台建设向政府部门间的信息共享和通信系统建设转移,彼此之间的数据
电子商务能够提高企业的效率、增强企业的竞争力,因此,电子商务作为一种新型商务模式正在全球范围内迅猛地发展。但是在其发展过程中,人们渐渐感觉到传统的电子商务实现技术
随着芯片技术的迅猛发展,越来越多的技术被应用到数字处理领域。在硬件中也越来越多的使用了更为复杂的算法。传统上常用DSP(Digital Signal Processor)处理器来进行数字信号
我国矿井事故的频发造成了严重的生命财产损失以及恶劣的社会影响,其中矿井运输事故占事故总数的26%~30%。为了降低矿井机车运输事故的重大损失,实现矿井运输的自动化、信息化
随着社会对云计算需求的持续扩大,规模巨大的数据中心不断被建立,而维护其运行需要大量的能量。随着传统能源的逐渐枯竭和价格的飞涨,维护运行数据中心的费用将会超过购买系
锂离子电池单体电压低、容量小,为了满足电动汽车的性能需求,一般将大量单体电池串并联成组使用。伴随着电动汽车的研究与推广,单体不一致性问题越来越受到广泛的重视。由于单体不一致,成组后的电池在容量利用率、循环寿命方面远不及单体电池,均衡管理是解决不一致性问题有效途径之一,具有重要的实践意义,而目前均衡控制方法的研究处于初期阶段,均衡控制策略比较粗糙,存在很多难题亟待解决,论文针对均衡控制策略展开了较为
人类动力学是一门理解与探索人类行为的统计性特征的新兴学科。研究学者已经通过使用万维网提供的海量数据,更好地研究、理解人类行为的各个方面。然而,随着云计算的逐渐普及
移动AdHoc网络是在没有任何固定网络基础设施或是集中管理情况下动态形成的暂时性网络。网络中节点缺乏物理保护,容易被偷窃、捕获,落入敌手后重新加入网络,导致攻击从内部产生