感知听觉场景分析的说话人识别

来源 :声学学报 | 被引量 : 0次 | 上传用户:shiqiuqiu100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对低信噪比说话人识别中缺失数据特征方法鲁棒性下降的问题,提出了一种采用感知听觉场景分析的缺失数据特征提取方法。首先求取语音的缺失数据特征谱,并由语音的感知特性求出感知特性的语音含量。含噪语音经过感知特性的语音增强和对其语谱的二维增强后求解出语音的分布,联合感知特性语音含量和缺失强度参数提取出感知听觉因子。再结合缺失数据特征谱把特征的提取过程分解为不同听觉场景进行区分地分析和处理,以增强说话人识别系统的鲁棒性能。实验结果表明,在-10 dB到10 dB的低信噪比环境下,对于4种不同的噪声,提出的方法比5种对比方法的鲁棒性均有提高,平均识别率分别提高26.0%,19.6%,12.7%,4.6%和6.5%。论文提出的方法,是一种在时-频域中寻找语音鲁棒特征的方法,更适合于低信噪比环境下的说话人识别。
其他文献
档案价值鉴定工作,是判定档案价值,决定档案保存、还是销毁的工作,是一项“去粗取精”、“去伪存真”的工作.开展这项工作的目的,在于正确的鉴定档案的价值,提高档案的质量,
中央档案馆声像档案管理简述○王政中央档案馆除了保存有大量的文件资料外,还保存着数以千计的声像档案,成为浩瀚馆藏档案的重要组成部分。中央档案馆现保存声像档案约8500余盘,以录
珍贵气象科技档案保护策略浅论倪景春吴增祥家气象档案馆保存有一大批解放前形成的原始气象观测记录表、簿和天气图、出版物等气象科技档案,具有重要利用价值。经历历史的沧桑
西江流域是多民系聚居的华南内河流域,客家民系是西江流域世居的一个重要民系.作为清代大移民潮下的外来移民,客家民系在广府民系占主体的情况下呈现大散居,小聚居的形态.广
一、乡镇企业的特点rn乡镇企业是市场经济形势下的新生事物,具有极其鲜明的时代特征和自身发展的个性,主要表现为:rn(一)数量大,行业多.就本县而言,到1997年末,全县共发展各
国有企业资产档案评估的几点思考■李云峰随着经济体制改革的深入和发展,国有企业将逐步建立适应市场经济要求,产权明晰、权责分明、政企分开、管理科学的现代企业制度。而建立
业主制下档案管理模式的实践与探索□胡宜芳清江是长江在湖北境内的第二大支流,干流全长423公里,流域面积17000平方公里。可开发装机容量329万千瓦,电能100亿千瓦时以上。开发清江具有发电、防
“三建”、“五服务”,利用见成效刘文丽地质科技档案是地质勘查找矿的极其重要的组成部分,是国民经济建设提供矿产资源开发与利用的基础资料。为了使本局地质科技档案资料从“
财会电算化会计档案研究郭筠王向阳近年来,随着电子计算机硬件与软件技术的飞速发展,企事业单位会计与财务采用计算机核算与管理的财会电算化事业如雨后春笋蓬勃发展。财会是电
乳腺癌是全世界女性癌症死亡的首要原因。近年来,用于乳腺疾病的检查也不少,主要有核磁共振(MRI)、CT、彩色多普勒超声、钼靶X线、红外线热图等。临床医生最常用彩色多普勒超声