基于语音文本融合的多模态情感识别

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:chezhenmen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,社交媒体正在人们的日常生活中发挥着越来越重要的作用。诸如微信、微博、QQ等社交软件已经成为了人们日常交流不可或缺的工具。与此同时,情感识别作为智能人机交互的重要基础之一,也得到了长足的发展。社交媒体中经常会使用大量的文本、语音、图片等多源信息。因此,近年来面向社交媒体的多模态情感识别研究正成为业内研究的热点,对实现智能人机交互应用具有重要意义。考虑到语音、文本信息之间的内在关联性和互补性,本文重点开展融合语音文本的多模态情感识别研究,提出了基于深度学习的语音、文本信息特征提取方法;深入研究了语音、文本模态融合算法;设计开发了语音文本融合的多模态情感识别应用系统,实现了模型的可视化应用。论文的主要研究内容如下:1.研究了基于深度学习的单模态情感特征学习模型。考虑到不同模态之间的差异性,本文将卷积神经网络(Convolutional Neural Network,CNN)和长短时记忆网络(Long-Short-Term Memory Network,LSTM)以双通道的形式结合起来,充分学习语音中的全局和局部情感特征;采用双向长短时记忆网络(Bid-directional Long-Short-Term Memory Network,Bi-LSTM)来捕获文本情感特征,使各个单模态的特征学习更加有效。在公开数据集IEMOCAP上,完成了相关的实验。实验结果表明:相较于其他模型,本文提出的单模态情感特征学习模型具有更高的识别准确率,验证了所提出的单模态特征学习模型的优越性。2.研究了基于深度学习的多模态融合情感识别模型。考虑到语音文本模态之间存在着关联性和互补性,本文通过特征融合的方法,对提取的单模态特征进行有效融合;并通过深度神经网络,对融合特征进行再次学习,提取出抽象的高级情感特征信息,用于进行最终的情感分析分类决策。最后,使用了正则化的方法,对模型进行了相应的优化,并在IEMOCAP数据集上达到了70.4%的识别率。该实验结果同其他研究结果相比,具有一定的优越性,充分验证了本文提出模型的有效性。3.设计开发了融合语音、文本的情感识别应用系统。融合语音与文本两种模态的情感识别的研究对于人机交互的实现有着良好的支撑作用。因此,本文提出了语音文本多模态情感识别应用系统框架。基于Python语言的UI(User Interface)开发工具包PYQT,设计和开发了情感识别系统。使用IEMOCAP数据集和录制数据进行测试显示,该系统能够有效应用多模态情感识别模型,识别出输入信息中包含的情感状态,具有较好实用性。
其他文献
中国生猪养殖业是一个弱质产业,一方面生猪养殖面临市场风险、疾病风险和自然灾害等多重风险,另一方面,中国生猪养殖业仍旧是以散养模式为主,农户的风险转移能力小,因此,农户
电影作为文化的重要载体,对社会产生了巨大的影响。虽然电影只是文化艺术的表现形式之一,但它对观众的影响、吸引和渗透已经达到了前所未有的独特地位。这不仅关系到世界格局
随着工业化、城镇化进程的加快,农村人口一直依赖的家庭和土地养老功能不断弱化,而农村社会养老保险制度和农民工养老保险制度并未受到参保对象的欢迎,没有起到有效分担老年
教育作为衡量一个国家综合实力指标的重要地位日趋增长。身为一名中国艺术院校造型专业的在校生,有关社会对美术学院教育方式的比较与评判已非罕见。然而,我注意到绝大多数的
在四川省新津县看守所里,一个老年男子在看守人员带领下从戒备森严的高墙内走进审讯室。这是一名被判处无期徒刑即将送监的犯人,他将在这里接受记者的采访。 In Xinjin Coun
<正>故障现象一辆2016款奥迪A6L车,搭载CYY发动机和0CK双离合自动变速器,累计行驶里程约为3万km。该车因发生前部碰撞事故,导致2个前照灯灯罩破损,灯光点亮正常,车主嫌更换前
“Дом”是俄语语言世界图景中重要的观念词,组成房屋的若干要素即该观念词的词汇主题群。通过谚语及风俗习惯分析观念词“дом”的词汇主题群,旨在揭示蕴含其中的丰富文
中心极限定理在概率统计中占有十分重要的地位,通过一道例题说明了中心极限定理在解决问题中的优势。
目的考察厚度和放置时间对木香饮片指标性成分含量的影响。方法采用HPLC法定期测定木香饮片指标性成分含量。结果在放置的6个月期间,不同厚度的木香饮片指标性成分含量均随放
针对现有旅游景点推荐个性化的不足问题,提出了一种基于信任关系与于情景上下文的旅游景点推荐算法。首先在传统的协同过滤算法上以用户信任度代替相似度来解决数据稀疏性;其次