论文部分内容阅读
听声辨人是人类的重要感知功能之一,一直以来人们希望能研究出具有人耳辨别声音功能的机器自动识别系统。随着语音学、听觉机理和分类模型的研究发展,当前在实验室环境下说话人识别系统已取得了较好的性能。在实际环境中,人说话时具有情绪,这对语音产生了很大影响。对具有情感的语音进行说话人识别称为情感说话人识别。由于训练和测试时的情感不一致导致的不匹配极大的影响了系统识别性能。对于人耳听辨,其识别性能也因情感语音的影响出现了下降。通过比较机器识别错误和人耳听辨错误的样例,发现两者错误的情形并不相同。本文研究了情感语音的发音特点,设计实现了机器识别系统和人耳听辨实验,通过语谱图,特征分析和听觉感受,分析对比人耳与机器在分辨情感语音的优势劣势。主要工作总结如下:1.设计实现了机器识别系统网站平台,使得说话人实验更加快捷方便,更好的满足了说话人识别的大量实验需求。2.设计完成了人耳在情感语音库下的听辨实验。3.进行情感语音下说话人识别的人机性能对比研究,针对情感、说话人和文本内容三个维度,对比分析人机识别的特点。通过对MASC库的听辨,详细分析了情绪对语音的影响,对呼吸音,哭腔,耳语音和重读这几种特点进行了详细分析。将情绪影响分为时间连续型和时间离散型两类,并得出了这两类影响下语音的人耳听辨结果。最后提出了有效的人机结合说话人辨识策略。