基于稀疏表示的语音感情计算研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:flyfox521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:语音情感计算是人工智能领域中语音识别研究主要问题,也是社会计算中一个前沿的新兴交叉学科问题。该文主要讨论机器学习稀疏表示在语音情感计算中的应用问题。在国际公开的语音情感数据库上研究了语音情感特征提取和识别算法,同时还讨论语音情感识别技术应用问题。实验结果表明,该文建议的稀疏表示语音情感识别算法较传统的稀疏表示具有较大竞争力。
  关键词:感情计算;语音;稀疏表示;范数
  中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)26-0171-02
  1 概述
  情感是否可计算属哲学终极问题,其衍生的情感能否计算?如果能,那么计算什么?如何计算?计算方法是否可行可靠?计算结果有何价值等等一系列问题[1]。虽然部分学者认为情感是人体专有的属性,但是随着人工智能的发展越來越多学者更加倾向于认同情感是可以计算的[2]。在情感计算对象、计算方法、计算方法可行性可靠性以及计算结果价值等都有着广泛的研究[3-7]。
  情感计算属自然科学与人文社会融合交叉的新兴领域,融合了数学、统计学、数理逻辑、计算机科学、神经科学以及哲学、心理学、认知科学、法学、社会学等学科知识。情感计算的奠基人Minsky认为通过计算算法可以将人的生理、表情、语言、姿态以及文字表达的情感进行测量与处理。也可以理解为情感计算是研发能感知、识别和理解人的情感并再进一步根据情感做出智能、灵敏、友好反应的软件系统,让计算机拥有如同人类一样拥有观察、识别和理解情感并做出相应的决策。
  目前为止,情感计算的对象可以分为人脸表情计算、人体姿态分析、语音情感和文本情感等。人脸表情计算通过对不同情感状态的人脸特征进行分析和识别,从而确定人的情感状态,语音情感计算通过提取语音情感特征相关参数从而设计出情感分类器分析语音的情感,主要应用于情感语音的合成方面[8-9]。人体姿态情感计算通常分为手势和身体姿势的情感识别,用于仿生代理或者机器人设计。基于文本分析的情感计算,又称文本情感分析(Sen?timent Analysis)是指利用自然语言处理和文本挖掘的相关技术识别出文本所带有的情感倾向的过程。虽然人工智能已经高速发展,但目前为止计算机只能识别“说了什么”, “谁说的”和“怎样说”也有着部分研究成果,至于“带着什么情绪说的”以及“话中需要表达的更深一步蕴意是什么”。研究“带着什么情绪说的”属于语音情感识别内容。
  2 稀疏表示
  稀疏表示是一种通过基本信号的线性组合来表达大部分或者全部的原始信号的方法。其中,这些基本信号被称作原子,是从过完备字典中选出来的;而过完备字典则是由个数超过信号维数的原子聚集而来 [10]。可见,任一信号在不同的原子组下有不同的稀疏表示。假设一个[M×N]的矩阵表示数据集[X]由[M]个数据样本构成,每个数据样本的维度是[N];表示为[X∈RM×N],其中[Xi∈RN]。在文本情感计算中,通常情况下[X]是稠密的,也即是即[Xij≠0]。 稀疏表示的基本含义是寻找一个系数矩阵[A∈RK×N]以及一个字典矩阵[B∈RM×K]使得[BA]尽量逼近[X],且[A]尽可能的稀疏,A便是X的稀疏表示。假设[RN]中存在[L]个子空间,第[j]个子空间的维度为[dj],相应的数据子空间表示为[Sj]。现假设用[Q=[q1,q2,…,qL]]表示相应的子空间集合。
  3.3 语音情感计算结果
  在柏林EMO-DB德语情感语音库的535个样本中,本文对7中情感状态进行综合实验,实验结果如表2所示。
  在535个测试样本中,平均识别率为94.95%。
  4 结束语
  本文通过稀疏表示算法在国际公开语音情感数据集柏林EMO-DB德语情感语音库的535个样本进行了实验,达到了平均94.95%的情感计算结果。虽然取得一定成果但仍存在不足,例如实验数据集虽然国际公开但仍较微小,下一步将引入更大的数据集进行实验,同时在稀疏表示上进行优化以提高语音情感计算效果。
  参考文献:
  [1] 李佳源.情感计算的研究现状与认知困境[J].自然辩证法通讯,2012,34(2):23-28 125.
  [2] 张迎辉,林学誾.情感可以计算——情感计算综述[J].计算机科学,2008(5):5-8.
  [3] 赵力,黄程韦.实用语音情感识别中的若干关键技术[J].数据采集与处理,2014,29(2):157-170.
  [4] 韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50.
  [5] 王薇,杨丽萍,魏丽,刘艳.语音情感特征的提取与分析[J].实验室研究与探索,2013,32(7):91-94 191.
  [6] 李书玲,刘蓉,张鎏钦,刘红.基于改进型SVM算法的语音情感识别[J].计算机应用,2013,33(7):1938-1941.
  [7] 黄程韦,赵艳,金赟,于寅骅,赵力.实用语音情感的特征分析与识别的研究[J].电子与信息学报,2011,33(1):112-116.
  [8] 赵腊生,张强,魏小鹏.语音情感识别研究进展[J].计算机应用研究,2009,26(2):428-432.
  [9] 林奕琳,韦岗,杨康才.语音情感识别的研究进展[J].电路与系统学报,2007(1):90-98.
  [10] 周志华,机器学习[M],北京:清华大学出版社,2015.
  [通联编辑:梁书]
其他文献
我国三大地带农村区域经济发展水平存在显著差距,造成这一状况的关键因素是农村产业结构的差异.为尽快缩小农村区域经济发展差距,促进区域经济协调发展,必须对农村区域产业结
心理健康问题人人都会遇到,教师也不例外。相关的调查、数据显示:近年来.中小学教师已经成为心理健康问题的高发人群。受其工作性质影响,为人师表的角色让教师承受了多方面的压力
摘要:该文以微课《巧说循环》在课程《动态网页开发》教学中混合式教学实践为依据,总结出在理论难度大、知识面覆盖广的项目化课程的教学中,综合运用翻转课堂和传统课堂教学完成高效教学的模式,从而达到即关注到学生知识的理解和记忆,也关注到学生对知识的评价和使用的教学目标。  关键词:微课;混合式教学实践  中图分类号:G642 文献标识码:A 文章编号:1009-3044(2018)32-0149-02  
层状陶瓷材料Ti3SiC2结合了金属和陶瓷的许多优异性质,既具有与金属相似的良好的导热、导电性,良好的可加工性,相对柔软,抗热震性好,可塑性变形等性能,同时又具有与陶瓷相似
任何课程都具有特定的课程内容和形式。课程内容是由课程的性质决定的,而课程形式反映了课程内容的要求。综合实践活动课程作为一种实践性课程,需要以整合的理念处理好内容与形
摘要:布卢姆教育目标分类学(修订版)对大学计算机应用基础课程教学目标的制订有重要启发和指导作用。首先,有助于我们在该课程的教学领域制订更为全面、更为科学的课程目标,不再局限于对事实性知识的记忆。其次,要通过知识和认知过程的不同结合方式来拟定课程目标。此外,将布卢姆教育目标分类学(修订版)应用于大学计算机应用基础课程目标制订时,对于明确该课程的教学目标、提高教学效率是很有价值的。  关键词:大学计算
江泽民同志“三个代表”重要思想,已经为全党所接受,并成为全党的行动指南,同时受到了全国人民的衷心拥护。当江泽民在广东发表“三个代表”重要讲话两周年之际,我陪同中共中央党
期刊