基于高斯混合模型的与文本无关说话人识别的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:chubiao5201314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别始于20世纪30年代,从20世纪60年代开始日益成为当今的一个研究热点.说话人识别具有广泛的应用前景,如保安、公安司法、军事、财经和信息服务等领域.正因为说话人识别具有如此广阔的应用前景,国内外许许多多的工作者投身于这一领域的研究中,使得说话人识别方面出现巨大发展.但它还远远没有成熟.该文主要从识别模型的训练、判别方法和语音降噪等方面作研究探讨.在识别模型的训练方面,主要研究高斯混合模型的模型训练.第一,利用最大似然估计获取初始模型,然后用EM算法的重估结果对初始模型按一定比例进行修正,最终获得较优模型.第二,把第一种方法获得的部分最优个体作为遗传算法的初始种群,通过交叉、变异和选择,最后收敛到最优模型.遗传算法采用浮点编码,交叉和变异在一个种群的胜者组和败者组同时进行,最后改选择为优胜劣汰.判别方法方面,对一段语音中的帧得分进行不同变换,然后获得最终的得分,从而改善识别效果.语音降噪方面,先用谱减法对语音作轻度的消减,避免出现音乐噪声,然后用小波降噪方法对它作进一步的噪声消减.
其他文献
该论文在详细研究了H.26L的体系结构、核心技术的基础上,根据实时视频通信应用的需要,对H.26L的编码、解码算法进行了多层次的优化,大大提高了算法的编码速度,优化后的代码能
表层穿透雷达是利用电磁波对表层下目标定位、检测和识别的设备,在民用和军事领域应用十分广泛。与之相关的信号处理技术中,穿透成像可以有效地降低数据解译难度,意义重大。
完全植入式静脉输液港(totally implantable venous access ports,TIVAP)是一种可植入皮下长期留置在体内的静脉输液装置,包括尖端位于上腔静脉的导管部分及埋植于皮下的注射
目前,早期胃癌检出率逐年升高,占我国胃癌病例的6%-19%.早期胃癌是指癌组织局限在黏膜层或黏膜下层,而不论癌肿大小及有否淋巴结转移.目前,无论早期胃癌或进展期可切除胃癌,其
互连网络作为影响并行计算机性能的一个主要因素,已发展成为计算机组织和系统结构学的一个独立方向.该文对构成互连网络的交换开关、影响网络性能的参数以及网络路由和反死锁
目的:探讨品管圈活动对降低医嘱执行误差率的效果.方法:成立品管圈活动小组,确立“降低医嘱执行误差率”为活动主题.活动前对我科180份(住院病历102份,出院病历78份病历存在
亨特(Hunt)综合征,又称膝状神经节炎、耳带疱疹或带状疱疹面瘫综合症,本病由面神经膝状神经节内的水痘带状疱疹病毒损害所导致,继而出现面瘫、耳部疱疹、耳痛三联征.临床上最
目的:对超声诊断子宫内膜病变价值的分析与探讨.方法:自2014年4月至2015年9月,从我院所收治的子宫内膜病变患者中选取60例参与研究,将患者进行超声诊断的结果与病理诊断结果
随着我国社会发展,人们生活水平的改善及生活方式的改变,高尿酸血症(H U A)及痛风等疾病的发病率逐年升高[1].高尿酸血症是嘌呤代谢紊乱,尿酸浓度升高引发的代谢性疾病[2].痛
目的;探讨肾嗜酸性细胞瘤的特点和治疗体会.方法;对9例肾嗜酸性细胞瘤病例进行回顾性分析,术中部分做快速冰冻切片,部分行肾癌根治术,部分行肾部分切除术.结果;病检9例均为肾