基于盲源分离的语音音乐信号分离算法的研究

被引量 : 0次 | 上传用户:yaoyaolf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音音乐分离就是将音频中混合的语音信号和音乐信号分离开来,分离后的信号可用于语音识别、乐器识别、音乐旋律提取和音乐流派分类等音频分析过程,盲源分离算法是解决从混合信号中提取各个原始信号的问题的有效方法,为语音和音乐信号的分离提供了有效途径。本文在线性瞬时混合的情况下研究了负熵最大化方法、基于时频比的盲源分离方法和信息最大化方法,并用于语音音乐信号分离,主要工作如下:第一,研究了基于负熵最大化改进的算法,用于适定语音音乐分离。针对负熵最大化方法中分离性能依赖于初始矩阵选取的问题,采用牛顿下山法代替牛顿迭代法做为优化算法寻找最优矩阵,通过改变下山因子,使目标函数呈下降趋势,降低算法对初始值的依赖性。仿真实验结果表明,算法在不同初始值下均能较好的分离出源信号,改进后算法平均迭代时间比改进前减少26.44%,迭代次数减少69.15%,并且迭代时间和迭代次数均在较小范围内波动,较好地解决了初始值敏感的问题。第二,研究了基于时频比改进的算法,用于适定语音音乐分离。针对基于时频比的盲源分离将信号变换到时频域后计算量大且对算法有效的时频点较少的问题,用重复结构周期内的时频点代替整个时频域进行单源点的检测。重复结构内的时频点在每个周期内都有相似的值,通过对一个周期内时频点的检测,得到单源点的时频比,对这些比值构成的矩阵求逆就可得到对源信号的估计。仿真实验结果表明,在达到几乎相同相似系数的情况下,改进后算法检测的时频窗减少了51.90%,运行时间减少了56.72%,降低了运算量。第三,研究了结合经验模态分解和互信息最大化方法的盲分离算法,用于欠定语音音乐信号分离。针对信息最大化方法只能应用于观测数不少于源信号数的情况,采用经验模态分解和互信息最大化相结合的算法。根据重构信号与原混合信号的相似度选取固有模态函数构造新的信号,并与原混合信号组成新的观测信号,将欠定盲源分离转化为适定盲源分离,再以输出与输入信号之间的互信息为目标函数,自然梯度法为优化算法分离信号。仿真实验结果表明,经验模态分解和互信息最大化相结合的方法能有效的解决欠定盲源分离问题。
其他文献
客观分析了江苏省海安县油菜产业现状,基于现实状况将油菜产业定性为非主体产业,并对今后油菜产业发展提出面对实际、稳定规模、提高效益、稳定植油积极性的发展思路。
目的探讨不同年龄组儿童慢性咳嗽的病因。方法对2002年1月~2011年2月共186例慢性咳嗽患儿按年龄分为4组,并按诊断流程询问病史、进行体检、辅助检查、诊断性治疗,针对病因给予
本文以乙醇溶液为提取溶液,研究了红橘果皮中色素的提取工艺条件。分别考察了乙醇浓度、料液比、提取时间及提取温度对色素提取效率的影响,并利用正交试验设计确定最佳反应条件
随着科技的发展和电子线路的实际需求,作为一种理想的直流,高频交流能量转换装置,大功率射频振荡器已经广泛应用与各类电子产品中,是现代大功率射频电源的核心技术。大功率射频振
辣椒疫病是近年来辣椒病害中危害最严重的一种病害,该病在辣椒整个生育期均有发生。从2004年开始,对辣椒疫病的发生规律及防治现状进行了调查研究及探索,并提出了可行的综合
文冠果是我国特有的木本油料植物和珍贵的观赏绿化树种,又是治疗高血脂、高血压等心脑血管疾病的常用中药。本文在介绍文冠果生物学特性、经济价值的基础上,并对其在临沂市的
随着移动互联网的迅速发展,品牌可以借助各种音乐创意在移动社交媒体迅速传播,企业更挖掘产品内涵,创造出与品牌属性高关联性的音乐旋律,通过事件性的病毒式营销传播,借助移
膜法提溴技术作为提溴新技术之一,已研究近30年。膜法提溴包括气态膜法提溴和乳化液膜法提溴两个方面。综述了气态膜法提溴传质过程、提溴用膜及提溴工艺等方面的研究进展,介
鸟类多样性变化可以反映环境变化.运用样线法和样点法,于2000年9月至2004年6月对武汉市区及市郊鸟类种类组成和多样性进行了调查.结果共记录鸟类127种,分属于16目49科91属.区
<正> 中、小学音乐教育是义务教育中美育的组成部分,是面向全体学生的音乐文化教育。而音乐艺术不外乎声乐、器乐两大类。近年来,国家教委将器乐教学内容正式纳入中、小学音