语音情感特征提取方法和情感识别研究

被引量 : 0次 | 上传用户:wf136156491
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在目前的语音情感识别研究中,情感特征提取和情感识别方法多种多样,而且由于各文献使用的情感语音数据库不同,识别结果不具有可比性,很难客观地判别特征及建模方法,尤其是采用全局特征建立静态模型和采用短时特征建立动态模型的优劣。本文对含有高兴、生气、悲伤和平静4种情感的语音信号,分析和选择了反映情感变化信息的语音特征,并在项目组录制的情感语音数据库上做了情感识别实验。主要研究内容如下: 1.录制了情感语音数据库。录音文本选自标准TIMIT英语语音数据库,每人以高兴、生气、悲伤和平静四种情感重复朗读25句文本,共录制了46个人、四种感情的4600句语音。通过主观情感感知实验,筛选出情感表达最好的8个人的800句语音,用于文本的情感分析和识别实验。 2.基于情感语音数据库,观察并分析了在四种情感状态下,语音信号的基频、谱信息、语速等特征的变化规律,选择和定义了具有情感判别力的基频统计特征、共振峰、语速、平均能量等23维全局特征,其中除了一般的基频全局特征外,还定义了基频曲线起始端上升和下降斜率相关的特征。 3.研究了高斯混合模型(GMM)的参数训练和识别算法,为全局情感特征建立了GMM语音情感识别实验,结果表明:如果只采用基频相关的12维特征,悲伤、平静的正确识别率较高,而高兴和生气容易被相互误识。加入共振峰、语速、平均能量后,各类情感的识别率都有所提高,这是因为语速、平均能量对四种情感具有判别力,而共振峰能够区分高兴和生气。 4.研究了隐马尔科夫模型(HMM)的参数训练和识别算法,针对提取的语音Mel滤波器组倒谱特征(MFCC),以及一组包括短时能量、共振峰、子带能量的短时特征,做了基于HMM的情感识别实验,结果表明,MFCC不适用于语音情感识别,而添加了子带能量、基频等特征后,平均识别率提高了29.55%。 5.对基于GMM和基于HMM的语音情感识别的结果进行了比较,分析表明:对于语音情感识别,采用全局特征建立静态模型,还是采用短时特征并为情感变化的动态过程建模得到的识别率基本相当,重要的是采用具有什么物理意义的特征。
其他文献
TI蜗杆传动,全称渐开面包络环面蜗杆传动,由渐开线斜齿圆柱齿轮及其包络的环面蜗杆组成。开展TI蜗杆传动的研究对开发研制高效、重载蜗杆减速机具有重要的理论意义和实用价值
在现代战争的信息对抗中,雷达作为敌我双方信息系统中的主要传感器,已经成为战争初期被攻击的首要目标之一。因此,能提高雷达的机动性从而提高其生存能力的车载雷达成为军事侦察
本实验以广西罗城毛葡萄主栽品种九龙二号、12号,二号为实验材料,分别以这三个品种的茎尖和幼嫩叶片为外植体,通过直接诱导丛生芽进行快速繁殖,并获得无根苗。同时运用热处理
法治政府、责任政府、服务政府具有各自的特定内涵和机制,它们之间具有很强的交叉性、包容性和统一性,其结合点主要体现在政府活动空间、责任性质和治理方式等方面的深刻变化
本文主要对吉林化纤股份有限公司“绿色纤维”工程进行了研究及如何应用作了论述。从国际、国内相关动态以及同行业发展及现状作了分析,并以此为依据对吉林化纤公司下一步发
随着科技的进步和生活水平的不断提高,我国汽车的销售量和保有量正呈现迅速增长的趋势,人们在购买汽车的时候不仅仅关注汽车的价格、安全性,同时对振动舒适性的要求也越来越
行政协助是指无隶属关系的行政主体之间由于职能的需要而进行的帮助与协作。行政协助是行政程序中的一项重要内容,它不仅关系到行政行为的实施,而且关系到整个公共行政的统一
目的综述乳腺癌保乳手术中乳房缺损的修复方法。方法分析近年来相关文献,对有关乳腺癌保乳手术中乳房缺损的修复方法、适应证、切口选择以及优缺点进行分析。结果保乳手术后
以科尔沁沙地主要造林树种杨树、榆树、油松和樟子松细根为对象,分析各树种细根生物量的垂直分布特征,探讨其与土壤水分和有机质的关系。结果表明,科尔沁沙地主要造林树种细