联合总变率空间和时延神经网络的说话人识别

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户：maxiao19810628

【摘要】

：

在短语音环境下,总变率空间对语音概率分布估计不足,导致说话人识别性能下降。针对上述问题,提出一种基于总变率空间和时延神经网络(TDNN)的增强说话人身份向量的方法。目的是学习总变率空间和时延神经网络的线性相关性,同时提取说话人嵌入向量并投影在新的空间上,组合成新的说话人超向量来增强说话人信息。训练阶段,分别训练总变率空间和时延神经网络,重新组建一个无关说话人集,从中提取身份向量和x向量并在典型关联分析(CCA)下得到投影矩阵;注册和测试阶段,抽取注册和测试说话人的嵌入向量,通过投影矩阵映射在新空间中,然后

【作者】

：

瞿于荃龙华段荧邵玉斌杜庆治

【机构】

：

昆明理工大学信息工程与自动化学院,昆明理工大学云南省计算机国家重点实验室

【出处】

：

计算机科学与探索

【发表日期】

：

2021年7期

【关键词】

：

总变率空间时延神经网络(TDNN) 典型关联分析(CCA) 短语音

【基金项目】

：

国家自然科学基金(61761025)。

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

蕴涵的决策蕴涵表示研究

形式概念分析能够使用概念格和(属性)蕴涵来对知识进行可视化和表示。决策蕴涵是一种特殊的蕴涵,而决策蕴涵的研究就是在蕴涵中建立并研究一个/多个封闭的子系统(包括决策蕴涵子系统及相应的语义和语构子系统)。为了进一步厘清蕴涵和决策蕴涵之间的关系,对由决策蕴涵子系统能不能得到整个蕴涵系统进行了研究。事实上,如果蕴涵可以由决策蕴涵推出,那么关于蕴涵和规范基的研究就可以转化为决策蕴涵和决策蕴涵规范基的研究。首先给出了蕴涵可以由决策蕴涵表示的充要条件;接着通过实例表明,存在一些蕴涵不可由决策蕴涵表示,因此进一步区分了直

期刊

形式概念分析(FCA)概念格蕴涵决策蕴涵

密度Canopy的增强聚类与深度特征的KNN算法

K最近邻(KNN)算法作为目前使用最广泛的有监督分类算法,在大规模、多维度数据的处理方面往往是低效的,因此提出了一种适用于高维度大数据量处理的改进KNN算法.首先采用深度神

期刊

K最近邻(KNN)密度Canopy增强聚类深度神经网络(DNN)近似相似性搜索(ASS)

基于Pearson特征选择的随机森林模型股票价格预测

为了能够更好地预测股票的走向趋势,解决在大量特征和大数据下预测精度低的问题,在随机森林的基础上提出了一种基于Pearson系数的随机森林新的组合模型方法。利用Pearson系数进行相关性检验删除无关特征;使用改进的网格搜索法对决策树参数调优;利用随机森林将剩余特征进行建模回归预测,并得出最终结论。实验结果表明:改进后的随机森林在预测值的平均绝对误差(MAE)、均方误差(MSE)都得到了较大的提高。其中今世缘改进后的随机森林比传统随机森林的MSE值降低了56%,MAE值降低了37.3%,其他两只股票预测效果

期刊

Pearson系数随机森林股票预测

序列数据的数据增强方法综述

为了追求精度,深度学习模型框架的结构越来越复杂,网络越来越深。参数量的增加意味着训练模型需要更多的数据。然而人工标注数据的成本是高昂的,且受客观原因所限,实际应用时可能难以获得特定领域的数据,数据不足问题非常常见。数据增强通过人为地生成新的数据增加数据量来缓解这一问题。数据增强方法在计算机视觉领域大放异彩,让人们开始关注类似方法能否应用在序列数据上。除了翻转、裁剪等在时间域进行增强的方法外,也描述

期刊

序列数据数据增强深度学习

基于注意力生成对抗网络的单幅图像去雨方法

下雨是一种常见的天气现象,而滞留在图像上的雨条纹降低了图像的清晰度以及影响了基于该图像的后续图像处理。从图像中去除雨的关键是如何准确、鲁棒地识别图像中的雨区域。使用导向滤波器和Haar小波变换组成的雨线提取模块来增强雨条纹特征提取,然后通过空间关注模块生成雨线注意力图,以准确定位雨条纹的位置。两者结合后,获得降雨条纹的前景信息再通过生成对抗网络训练机制中相互博弈的特征,可以增强雨条位置识别能力,并

期刊

生成对抗网络注意力机制图像去雨

多模态的情感分析技术综述

情感分析是指利用计算机自动分析确定人们所要表达的情感,其在人机交互和刑侦破案等领域都能发挥重大作用。深度学习和传统特征提取算法的进步为利用多种模态进行情感分析提供了条件。结合多种模态进行情感分析可以弥补单模态情感分析的不稳定性以及局限性等缺点,能够有效提高准确度。近年来,研究者多用面部表情信息、文本信息以及语音信息三种模态进行情感分析。主要从这三种模态对多模态情感分析技术进行综述:首先对多模态情感分析的基本概念以及研究现状进行简要介绍;其次总结了常用的多模态情感分析数据集;然后分别对现有的基于面部表情信息

期刊

多模态情感分析模态融合

面向RFID动态帧时隙ALOHA协议的帧长优化

近年来,国家电网积极推动泛在电力物联网的建设,以实现电力系统的万物互联与优化管理。其中,射频识别技术(RFID)作为泛在电力物联网建设的核心技术,凭其价格低廉、无需电源、非视距通信、远距离通信等特点,被广泛应用于电力仓储物资管理、电力巡检等应用场景。为了盘点电力设备仓库中的物品,需要快速识别粘贴在物品上的标签,然而由于仓库中存在大量标签,在通信过程中容易产生标签信号冲突。针对当前商用RFID系统普

期刊

射频识别(RFID)动态帧时隙ALOHA帧长优化马尔可夫决策过程(MDP)Q-LEARNING

改进双向LSTM的肺结节分割方法

基于深度学习网络在医学图像分割方面取得了很多成果。由于类圆形的肺结节不同于血管和大部分肺部结构呈扁平状,因此通过对U-Net进行扩展,提出一种带有多视图密集卷积的双向LSTM U-Net网络来消除血管和肺内组织结构以检测结节。与U-Net在跳跃连接中进行级联不同,改进双向LSTM网络将编码路径中提取特征图与解码卷积层进行非线性结合。为了加强特征传播和鼓励特征复用,在编码路径的最后一个卷积层采用密集

期刊

肺结节密集卷积跳跃连接编码路径结节分割

随机特征映射的四层神经网络及其增量学习

提出了一种基于随机特征映射的四层神经网络(FRMFNN)及其增量学习算法。FRMFNN首先把原始输入特征通过特定的随机映射算法转化为随机映射特征存储于第一层隐藏层节点中,再经过激活函数对随机映射特征进行非线性转化生成第二层隐藏节点,最后将第二层隐藏层通过输出权重连接到输出层。由于第一层和第二层隐藏层的权重是根据任意连续采样分布概率随机生成的而不需要训练更新,且输出层的权重可以用岭回归算法快速求解,从而避免了传统反向传播神经网络耗时的训练过程。当FRMFNN没有达到期望精度时,借助于快速的增量算法可以持续改

期刊

神经网络机器学习随机特征映射宽度学习通用逼近增量学习岭回归正则化

基于多重注意力的金融事件大数据精准画像

随着知识图谱技术的兴起,利用金融事件大数据中的实体关系来构建金融事件的精准画像成为一个重要的研究方向。通过对金融事件大数据信息进行精准画像,人们可以详细分析金融事件大数据中的属性关系,全面了解金融事件的发展态势,从而分析金融市场发展趋势与规律。然而金融事件大数据存在文本数据噪音多、中文语义复杂以及实体关系抽取不准确等研究难点,导致金融事件大数据画像不精准。针对以上问题,提出一种基于多重注意力的金融事件大数据实体关系抽取算法(REMA)来进行实体关系的抽取,然后利用抽取的实体关系信息结合知识图谱技术进行金融

期刊

金融事件大数据精准画像多重注意力机制实体关系抽取

联合总变率空间和时延神经网络的说话人识别

与本文相关的学术论文