语音中身份与情感信息提取及其在普适计算中的应用

被引量 : 0次 | 上传用户:lcc54202346
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要是对语音分析中的说话人和情感进行研究,并将此应用于一个普适计算e Learning系统。说话人识别的工作重点在于对识别的实时性要求较高,将系统运行的时间放在首要位置,同时还要保证系统的高识别率。为此,在特征提取算法上进行了MFCC(Mel frequency cepstral coefficients)算法的改进,提出了快速差分MFCC算法,提高了系统的运行速度,同时还和FFT,LPC进行识别率的比较,得到了较好的识别效果;在进行特征分类时,主要是对距离测算法,矢量量化法(VQ)和高斯混合模型(GMM)进行分析研究,根据各种方法的优缺点,提出一种VQ和GMM的混合分类算法,此方法兼顾了识别率和运行速度两方面的因素,能够较好的满足实时性的要求。我们将提出的新方法和一些传统的方法进行实验对比,在分类方法为欧式距离的条件下,采用LPC算法的EER是14.3%,采用FFT算法的EER是11.4%,采用改进后的快速MFCC算法的EER是4.3%,同时快速MFCC算法所用的时间为4.0s,完全满足实时的要求。本文在基于快速MFCC特征提取算法的基础上,引入差分MFCC,同时经过VQ+GMM分类算法,获得了比较好的识别效果:此时,采用LPC算法的EER是14.4%,采用FFT算法的EER是12.5%,采用改进后的快速MFCC算法的EER是9.4%,采用改进后的差分MFCC算法的EER是6.9%;最后是进行分类算法的比较,在特征提取算法为差分MFCC的基础上,采用欧式距离匹配法的EER是15%,采用VQ分类算法的EER是11.2%,采用GMM的EER是4.4%,采用VQ+GMM的EER是6.9%,虽然VQ+GMM的方法识别率有所降低,但是其运行时间从单独采用GMM的6.0s变为4.5s,能够更好的适应实时的要求。在情感分析方面,主要用了语音中基频及其相关参数作为语音特征对说话人的情感进行统计判断。最后将说话人识别和情感分析放入e-Learning系统中,达到了一种无处不在的普适服务。
其他文献
本论文通过阐述国家电力体制改革的主要内容和重大举措,论述了发电行业当前的竞争格局,提出了建立发电企业竞争力评价指标体系的必要性。有针对性地继承和吸纳了国内外相关学
控制性超排卵(controlled ovarian hyperstimulation,COH)是指通过运用促排卵药物使得一个月经周期能够获得足够数量的卵子,以便得到多个可供移植的胚胎。COH已经广泛应用于体
<正>古诗词最常见的艺术手法就是借景抒情,这也是古诗词鉴赏部分最常考查的知识点。虽然常见,依然有难度;因为常考,必须引起重视。借景抒情的三大特点(1)所有景物共同指向某
期刊
本文通过对I SO 9001-2008标准的第7.5.2条"生产和服务过程的确认"进行剖析,阐述如何识别需确认的生产和服务过程,对比"特殊过程"与"需确认的过程"的异同,对确认和控制"需确
智能手机作为智慧旅游用户感知层面的主要终端,承载了信息获取和发布的核心职能,已经成为用户参与、体验智慧旅游的主要入口和平台。本文采用问卷调查的方法,进行用户使用行
新古典效率理论是基于完全竞争条件下的配置效率理论,目前居于西方经济学的统治地位。这个理论由于其内在缺陷,而遭到众多经济学家的批判。新古典效率理论的缺陷主要表现在以
本文描述了水洞实验中基于浮动床的流体边界层阻力测量天平和基于氢气泡的流动显示系统的设计及研制。依据动压管测速原理,设计毕托管、差压传感器及数字电压表组成的水洞流体
加入WTO后,中国面临着越来越大的“开放天空”的压力,对中国民航业来说,这既是融入世界航空联盟千载难逢的机会,又是可能被对手挤压和吃掉的挑战。
作为海商法方向的学位论文应当紧紧跟踪业务实践发展,满足实践中需要,努力认清和解决实践中出现的问题。本文作者为实现此目标做了大量的工作,试图进行有益的研究。我国尚没
阿尔茨海默病又称老年痴呆症,是一种中枢神经系统原发性退行性病变。关于阿尔茨海默病的发病机制仍然不能完全确定,普遍认为它与Tau蛋白修饰、Aβ毒性以及神经细胞凋亡等因素