基于多核SVM-i-vector的短语音说话人识别技术及其在巡检系统中的应用

来源 :东南大学 | 被引量 : 0次 | 上传用户:jscumt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术作为生物识别技术的一种,因其所具备的方便性、非交互性、准确性等特点被广泛应用于生物识别领域。现有的说话人识别算法在实际使用时,受到信道干扰、环境噪声及说话人语音长短等不同因素的制约,其识别准确率往往受到较大的影响。因此本文针对短语音的说话人应用场景下,提出对提取到的说话人i-vector特征矢量运用多核SVM进行分类判决,以此提高对于短语音的识别准确率,并将其应用于巡检系统进行测试。首先,本文对语音信号处理技术进行了研究,选择了符合人耳特性的MFCC特征参数。对基于i-vector的说话人识别技术进行深入研究与实验,训练了GMM-UBM模型,以此获得说话人的i-vector特征矢量,并通过LDA进行信道补偿。其次,对多核SVM技术进行研究,设计了基于多核SVM-i-vector的短语音说话人识别系统,对不同核函数分别进行实验,得到各核函数使系统识别率最高时的参数,并基于这些参数将核函数进行各种线性组合,通过实验选取使系统识别率最高时的组合,将该组合下系统识别率与使用单核SVM及不使用SVM的系统识别率进行比较,并分别在不同语音时长及噪声环境下进行实验。实验结果表明使用多核SVM对i-vector特征矢量进行分类判决可以获得较好的系统识别率,并且在语音时长越短时,其识别率提高越明显,表明其更好的适用于短语音应用场景。接着,将基于多核SVM-i-vector的短语音说话人识别技术应用于巡检系统,设计系统总体架构及系统流程,并通过实验对系统进行测试。测试结果表明系统具有良好的稳定性及可行性。最后,对本文工作任务进行总结,并对系统的不足加以分析,展望后续研究方向。
其他文献
摘要:当前我国正处在大力发展生产力的时期,同时正在大力实施创新创业发展战略,而人是创新创业的关键因素。创新创业的驱动归根结底也是人才的驱动,对于高校来说,必须将有关的创新创业发展战略深入到推进创新创业的有关教育中去,以此增强大学生的创新精神与创业意识,同时也需要在一定程度上培养大学生的创新创业能力,所以要求有关高校必须保证创新创业教育的质量与数量,从而提高创新创业教育的效率。本文简单阐述了在创新创
北苏丹罗赛雷斯大坝加高工程,采用1000t级超大预应力锚索,支撑弧门、闸门强大的静水和动水压力。本文介绍了该超大吨位锚索设计和全过程施工技术措施,成功地解决了现场施工难
本文以运输问题,下料问题和人员班次安排为例,论述了建立线性规划数学模型的一个原则,即尽量使用不等式约束来建立模型的原则。
长河坝水电站对汤坝料场边坡经过初期外部变形观测,变形范围增大后,及时布设测斜管,掌握滑动面;根据边坡开挖进展及治理的现状,扩大监测范围,增加测斜管;随着永久边坡形成,及
本文提出一种用正交尺度函数代替RBF网络中的激活函数的小波网络,给出相应小波网络学习算法;并以天津市国内生产总值为样本进行宏观经济模拟预测,预测结果表明该模型预测误差
四川省是长江流域上游血吸虫疫区,历史上血吸虫分布广泛。人畜血吸虫病发病率高。从2004年起,我省在长江委、省水利厅领导下,积极开展了两轮水利血防建设,完成投资8.192亿元。我省
在我们上期的文章中,我们就魔兽对战中的各种宝物的性价比做了详细的介绍,由于篇幅原因本期我们继续为大家介绍魔兽中的宝物。这也是我们《做个魔兽经济学家》系列的第四部。
期刊
许巍说:“我从来不觉得我一定要成为每个人心中认定的摇滚乐手,我只是我自己,别人认为我是摇滚风格的也好,民谣风格的也好,纯粹流行乐的也好,都没有任何关系。
期刊
“五字教育”又称“孝宽诚责毅”教育,首提于正德职业技术学院。本文研究发现,“孝”“宽”“诚”“责”“毅”在人的内在中具有统一性,对大学生群体具有特殊功能。文章进一
本文对高寒高海拔地区水利施工中沥青拌合设管使用、管理进行了总结,对在高寒高海拔地区沥青施工有一定指导作用.