基于稀疏表示和信道补偿的说话人识别

来源 :东南大学 | 被引量 : 2次 | 上传用户:smoking8302
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各种安全问题的不断出现,生物识别技术受到了越来越多的重视。说话人识别以其简单、安全等特性得到了广泛的应用。经典的GMM-UBM模型虽然取得了不错的效果,但是其计算量过大,区分性不强,且背景噪声和信道失配等问题也导致了系统性能的下降。本文针对这些问题展开了研究,主要研究的内容有:首先,采用二阶差分MFCC特征参数来刻画说话人的语音特征,使用经典的GMM-UBM模型。在此基础上增加了 i-vector向量,相比于联合因子分析的方法,i-vector只需训练一个全局差异空间,用这个全局差异空间来表示与说话人相关和与信道相关的信息。每个说话人的语音特征就由i-vector向量来表示。在i-vector空间上应用概率线性鉴别分析(PLDA)进行降维和信道补偿,在一定程度上提高了系统的性能。然后,在i-vector的基础上,引入了稀疏表示,介绍了基于i-vector的稀疏表示分类器。通过将训练语音提取的i-vector构造字典,而将待测说话人语音提取的i-vector表示为字典中原子的线性组合,根据稀疏表示系数对信号进行重构,通过重构信号和原始信号之间的残差,决定待测语音信号所属的类别。针对GMM混合度越高,系统的识别率越好,但随着维数的升高,系统计算的复杂度也相应的增加。为此,引入了 PPCA算法进行降维。相比传统的主成分分析(PCA),PPCA考虑到成分的概率分布,决定所选取的主成分,克服了 PCA只是简单的选取最大的几个特征值对应的特征向量,不能保证所选择的主成分一定是对特征向量贡献最大的,从而造成系统性能下降的问题。通过对PPCA进行去相关、最优降维、降噪实验,及PPCA与PCA的对比试验,可以看出PPCA降维,能够保持识别率不会降低,甚至出现轻微的增长。同时PPCA的降维性能也优于PCA。最后,对本文所做的研究做了详细的总结,总结了本文的贡献和不足之处。同时,对说话人识别未来的发展做了展望。
其他文献
2017年中国社会消费品零售总额达36.6万亿元,其中网购占比15%,消费成为国民经济的第一驱动因素。随着移动互联网普及,用户增速放缓,流量红利消失,纯电商进入发展瓶颈,线上巨
为改变危化品生产包装环节依靠手工生产的现状,危化品包装行业需要提升包装生产线的自动化水平,这也是时代发展的必然趋势。危化品生产涉及国家安全,以及人民的生命和财产安全。在目前国内现有包装技术难以满足危化品包装的市场需求,也无法得国外相关技术支持的情况下,本课题研发设计适用于粉状危化品上袋包装机的自动上袋装置。本文的主要内容包括:首先,利用概念设计分析了上袋工艺的功能需求,并将上袋功能分解成不同的子功
富勒烯是纳米物理研究和应用中比较重要的一类团簇分子,上世纪八十年代C60被发现制备,人们对该典型笼状富勒烯进行了大量研究,并在材料、医学等广泛的实际应用领域展开探索。
目的:肺癌是目前影响人类健康的主要癌症之一,非小细胞肺癌则是肺癌的主要类型。肺癌死亡率一直居高不下,开发新型抗肺癌药物迫在眉睫。本研究探讨一种新型双芳基脲类化合物(
永磁同步电机现已广泛应用在工业生产和日常生活中,随着科学技术的进步和人们对生产、生活水平的要求越来越高,具有交流调速系统的相关装备和设施对其控制策略提出了更高的要求。模型预测控制应用在永磁同步电机交流调速系统上可以同时优化多个控制目标,面对不同的应用场合,可以灵活调节各控制目标的控制性能,同时具有优秀的动态和稳态性能。本文以永磁同步电机传统直接转矩控制为基础,结合模型预测控制理论,主要围绕改善电机
近年来,我国提倡大力发展职业教育。“十一五”规划纲要实施以来,我国职业教育聚焦提升人才培养质量,由普教化、技能化逐步向全人教育转变。高分低能的“应试机器”,缺乏独立思考能力的“指令执行者”和只懂技术却品德低下的“技术工具”已不再满足职业教育的人才培养目标。除了过硬的专业知识和高超的行业技能外,现代职业教育更关注“准职业人”高尚的伦理道德情操、良好的品行习惯和健全的精神人格的。礼仪,是社会交往的行为
随着纳米结构的提出,纳米材料受到越来越多的关注,其中一维纳米结构因其独特的各向异性、较少的缺陷位点、良好的传质导电性等优点受到追捧。因此人们尝试制备一维Pt纳米线应
卷积神经网络(convolutional neural networks,CNNs)在计算机视觉、语音识别等领域取得显著成功的同时,网络深度和宽度进一步增加,这导致了网络计算复杂度的急剧上升。目前卷积神经网络的参数量是数以万计的,网络所需的巨大内存和高额的计算量消耗,制约着深度学习在资源有限的移动设备上的应用。本文引入新的通道剪枝方法降低网络浮点运算量(floating-point operati
钢管腐蚀是钢管混凝土拱桥的一大病害,腐蚀短期效应并不明显,但经过长期积累腐蚀的影响却很大,随着在役钢管混凝土拱桥的龄期增长和所处环境的变化,腐蚀的影响将会越来越明显
《走近科学》,是中央电视台综合频道推出的一档科普类综合电视节目。节目弘扬了科学精神,宣传了科学思想,真实地记录了社会生活中的焦点和热点。每一期节目都有一个新闻栏目,讲述热点新闻背后的科学问题以及其发展中的重要问题。但是,《走近科学》目前只有中文版本,为让更多国外人士人了解中国的科技发展,《走近科学》的翻译具有重要意义。本次口译实践在释意理论的指导下完成。释意理论诞生于2 0世纪6 0年代的法国巴黎