情感说话人识别的人机性能对比研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:sfyaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
听声辨人是人类的重要感知功能之一,一直以来人们希望能研究出具有人耳辨别声音功能的机器自动识别系统。随着语音学、听觉机理和分类模型的研究发展,当前在实验室环境下说话人识别系统已取得了较好的性能。在实际环境中,人说话时具有情绪,这对语音产生了很大影响。对具有情感的语音进行说话人识别称为情感说话人识别。由于训练和测试时的情感不一致导致的不匹配极大的影响了系统识别性能。对于人耳听辨,其识别性能也因情感语音的影响出现了下降。通过比较机器识别错误和人耳听辨错误的样例,发现两者错误的情形并不相同。本文研究了情感语音的发音特点,设计实现了机器识别系统和人耳听辨实验,通过语谱图,特征分析和听觉感受,分析对比人耳与机器在分辨情感语音的优势劣势。主要工作总结如下:1.设计实现了机器识别系统网站平台,使得说话人实验更加快捷方便,更好的满足了说话人识别的大量实验需求。2.设计完成了人耳在情感语音库下的听辨实验。3.进行情感语音下说话人识别的人机性能对比研究,针对情感、说话人和文本内容三个维度,对比分析人机识别的特点。通过对MASC库的听辨,详细分析了情绪对语音的影响,对呼吸音,哭腔,耳语音和重读这几种特点进行了详细分析。将情绪影响分为时间连续型和时间离散型两类,并得出了这两类影响下语音的人耳听辨结果。最后提出了有效的人机结合说话人辨识策略。
其他文献
<正> 芥酸是生产高温润滑剂及用于塑料和油漆生产的一种化工原料,过去多从油菜籽中提取。但由于其价格飞涨,促使化学公司寻找新的来源。据美国衣阿华州农业试验站的约翰·迈
文章介绍了新型单总线结构温度传感器DSl8B20的结构特征及控制方法、并以此为传感器,以89C205l 单片机为构成的温度测量装置的电路组成、原理、程序设计.该装置适应于人民日
李商隐的"无题诗"在晚唐诗歌中别具一格。超现实主义是产生于法国的文艺流派,其影响深远。超现实主义诗歌、电影、绘画等作品在艺术表现上具有一些共同的特点,常用"深层隐喻"
<正>目前,我国的许多临床医生,实际上是给国外的企业和药厂做推销员。因为国产的许多医疗装备发展很落后,以致于80%是国外进口的,20%是国内企业的产品。即便这20%的国内企业
煤矿井下带式输送机肩负着煤炭的运输重责,是煤矿生产的关键设备。采用PLC可编程控制器,研究了带式输送机节能控制系统,该系统主要由现场控制和集中控制组成,分析了控制系统
可穿戴技术是当前科技领域的热点与前沿问题,并已开始应用于教育,医疗,工业等社会各个领域。它为人们的学习,生活和工作提供了前所未有的便利。本文简要概述可穿戴技术的定义
辽宁和朝鲜区域一体化是中朝经贸合作的重要组成。在两地区的合作中,尚存在互市场所的建设不完善、边境城市的建设相对落后、朝鲜对自贸区及经济特区管理不当、以及银行信用