基于半监督学习的语音情感识别研究

来源 :天津师范大学 | 被引量 : 2次 | 上传用户:tommy8248
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的快速发展使得人类与计算机的关系日益密切,智能人机交互已成为人工智能领域内的研究热点之一。情感识别作为智能人机交互的关键技术之一,在其中也扮演着重要角色,对其研究也在如火如荼地进行。由于语音是情感表达的有效途径,因此智能计算机对语音的情感识别能力就成为情感识别研究中的重点。本文首先对语音情感识别的背景及应用领域做了介绍,然后对语音情感识别关键技术的研究现状及目前遇到的问题进行了总结,对语音情感识别的研究进展和研究成果进行了综述。本文在参考现有情感语音录制方法的基础上,构建了情感语音数据库,并对语音信号进行了一系列预处理操作,对语音情感特征进行了分析和提取,确定了用于本文研究的11种情感特征参数。语音情感识别在本质上属于模式识别的分类问题。采用传统的有监督机器学习方法进行情感分类时,需要在很大的训练集上建立待标注概念的统计模型,从而保证所得到的分类器具有良好的推广性能。而训练样本的人工标注是一件很费时费力的工作,尤其是针对语音情感识别用的语料库,迄今为止可利用的资源又很有限。半监督学习是一种利用未标注样本中隐含的信息来提高分类器泛化能力的方法,在很多领域中已得到广泛应用。它能够有效地减少制作语音情感识别语料库时所必须的手工工作量。基于此,本文将半监督学习方法用于语音情感识别。以条件随机场模型为初始分类器,通过自训练算法,对未标注样本进行标注选取置信度较高的数据加入到训练集。通过循环迭代得出最终的语音情感识别分类器。本文采用该方法进行了语音情感识别,并将它与有监督的机器学习方法进行了对比实验。实验结果表明,该方法具有较好的整体识别性能,能有效提高语音情感的识别率。
其他文献
传统的机器学习、数据挖掘算法是基于向量型数据提出的。由于结构化数据在现实应用中广泛存在,图形数据的表示和分析正得到越来越广泛的关注。由于图数据结构的复杂性,不能仅
随着应用层组播技术的不断进步和网络服务质量的不断提高,差错恢复显得越来越重要,因此,提出一种高效的应用层组播差错恢复模型显得越来越迫切。   本文首先对传统的非应用层
随着科技的发展,多媒体数据库里的图像信息越来越多,并且增长速度越来越快,它在提供大量资料的同时给我们带来了烦恼:如何对如此大的数据库进行整理与分类便于用户进行检索。
21世纪是计算机网络高速发展的世纪,但与之同时,黑客入侵日益猖獗,计算机病毒越来越泛滥,这严重影响了计算机网络的正常运行。更为严重的是,网络战争也已经出现在了我们的面
随着互联网信息的快速增长,如何对海量文本信息进行有效聚类一直是文本挖掘领域的研究热点。传统的文本聚类算法通常采用向量空间模型(VSM)进行文本聚类,但是文本向量空间存
伴随着测序技术的发展,许多生物的全基因组序列已经得到,所以摆在生物信息学家面前的问题是如何理解基因组中所蕴含的生物学机制。蕴藏着大量的控制生命活动的遗传信息的生物
针对目前国内学生成绩分析这一部分,仅仅有庞大的数据库,却没有深层次分析导致学生成绩差异的因素,本文设计并完成了学生成绩分析系统。本文针对决策树中的ID3算法的计算过于
近年来,由于商业环境的瞬息万变,决策者需要更快更准的捕获商机。从存有大量历史数据的数据仓库中挖掘有价值的信息,对企业的运营及策略调整起着至关重要的作用。OLAP是决策
矿山主变压器是煤矿企业电力系统中的重要设备,它能将电流、电压进行重新分配,进而满足整个煤矿企业的正常生产和职工生活用电的需求。矿山主变压器一旦发生故障,将会给煤矿企业的经济和员工人身安全造成重大威胁。因此对矿山主变压器运行状态进行实时在线评估是非常有必要的。它能及早发现故障隐患,为煤矿企业生产的安全运行提供有力保障。首先,本文通过对变压器状态信息的分析,总结出变压器的故障原因、故障类型和维护方法。
随着人们生活水平的提高与生活节奏的加快,在电子商务的快速发展背景下,电子彩票已经被越来越多的人所接受,通过网络,手机等方式购买电子彩票是一个大的趋势。目前彩票种类分