基于模糊逻辑的语音情感识别

来源 :云南大学 | 被引量 : 0次 | 上传用户:lvyuxuan3652008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号处理作为一个重要的研究领域,已经有了很长的研究历史,它始终与信息科学中最活跃的前沿学科保持着最密切的联系。而人类的语音中不仅包含了文字符号信息,还包含了话者的情感等信息。作为下一代人类交互系统的重要组成部分,从语音信号中提取情感特征,判断说话人的情感状态是一个新兴的研究领域。 本文采用模糊逻辑方法研究语音情感分析与识别。情感无论是从其定义还是具体描述上都是一个模糊和不确定的概念,而模糊逻辑是处理不确定信息的需要而产生的。相关的研究表明,模糊逻辑在情感状态的建模以及对情感状态的激发和模拟上具有很大的优势。 本文相关实验是在语音情感标准数据库EMO-DB(Berlin Emotional Speech Database)下完成的。主要研究工作如下: (1)采用模糊熵方法对特征参数的有效性进行分析。在语音情感分析中,需要利用所提取的特征参数来决定语音信号的情感归属。不同的特征参数对于情感区分的作用是不同的,因此,有必要对所提取的特征参数的有效性进行分析,以提高情感的识别率。本文采用模糊熵方法来完成特征参数有效性的度量。 (2)采用模糊聚类中的两类不同方法实现情感聚类分析。模糊聚类算法大体可以分为两类:一类是生成一个模糊的划分,每个对象以不同的隶属度从属于若干个类;另一类是生成若干个确定的划分,再从中选取一个,使得每个对象从属于特定的类。本文探索该两类方法在语音情感分析与识别中的应用,并给出针对EMO-DB数据库的实现结果。 (3)引入直觉模糊集理论和信息区分度方法进行语音情感状态分析与识别。直觉模糊集理论是一种知识表示的新方法,它采用隶属度、非隶属度以及直觉参数等三个特征函数对事物进行描述。本文引入信息区分度方法实现两个直觉模糊集合之间的距离测度。 实验结果表明,用模糊逻辑来处理语音情感识别是一种行之有效的方法,其识别率可以达到预期的结果。但是,由于该方法中的某些环节还没有公认的理论支持和严密的数学证明,这给实际应用带来了困难,但有许多问题值得进一步探索。
其他文献
模型预测控制方法是控制理论与计算机技术相结合而产生的一种新型控制策略。传统的模型预测控制方法使用的预测模型都是系统的线性预测模型,不能直接应用于具有强非线性的工业
在网络高度发达的今天,搜索技术能使人们快速的从海量的数据中找到有用的信息,因而在现代生活中扮演着越来越重要的角色。对于文本内容的搜索,已有非常成熟的技术,而对于多媒体内
超声多普勒技术因其无创伤检测血管疾病,50多年来在临床医学中具有广泛的应用。利用超声波的多普勒效应,结合血流动力学和病理生理学,在高血压、糖尿病、心率衰竭、动脉粥样硬化
随着武器系统的发展,武器性能的试验测试日益复杂。试验过程仅靠人工编排已不能满足大系统的要求,为了使试验规划更加科学合理有效,将计算机辅助决策技术应用于试验规划过程具有
新型导弹以宽广的飞行包络、极高的飞行速度、超强的机动性为特征,其动力学特性表现为强耦合及强时变性。相对于传统型号,其控制系统的设计难度大大增加。继续沿用传统的控制方
纸币广泛地应用于人们的日常活动中,为了防伪纸币都统一印制了号码,每个印刷号码对应唯一的纸币印品。对印刷号码的检查普遍都是人工完成的,在长时间的检查工作中,很容易出现检测
近年来,随着物联网的发展,RFID(RadioFrequency Identification,射频识别)技术引起了人们的广泛关注。其中超高频段射频识别技术(UHF RFID)已经发展成为世界上新的研究热点。超
稳定、可靠和清洁的能源供应是人类文明、经济发展和社会进步的保障,煤炭、石油、天然气等化石能源支持了19世纪和20世纪近两百年的人类文明的进步和发展。然而,化石燃料的大
近年来随着应用需求的不断增加,多传感器信息融合技术得到了空前迅速的发展。信息融合技术通过对多个传感器提供的冗余信息数据进行充分的互补,能够得到更为客观、更为精确的数
本文对基于无信息先验的判别式学习进行初步的研究。与相关的其他研究相比,本文作者的工作有三个特点:(i)与纯粹数据驱动的、以通用求解器为目的的机器学习不同,本文充分利用先