基于孪生自动编码器的深度说话人嵌入向量

来源 :现代计算机 | 被引量 : 0次 | 上传用户:user180
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在说话人识别任务中,如何提取出更区分性的说话人向量来表征说话人一直是研究的重点。使用基于孪生神经网络的自动编码器提取出更具区分性的说话人嵌入向量。在开源的Voxceleb1说话人识别数据集上测试提取的新向量,通过实验表明,相比基线系统的x-vector,新向量在等错误率上获得相对22%的降低。
其他文献
随着低精度和多精度计算的发展,多精度计算已经成为一种有效的加速计算方法。在求解线性方程组时,为了保证方程解的精度,大多采用双精度浮点数进行乘法运算,但是在现代处理器中,单精度浮点数的乘法吞吐率都是双精度浮点数的两倍。因此,提出一种使用多精度SIMD加速求解线性方程组的方法,该方法在对精度要求不高的LU分解步骤使用速度更快的单精度浮点乘法,在对精度要求严格的计算残差步骤使用双精度浮点乘法。通过实验表明,在取得具有相同精度的方程解时,使用多精度SIMD求解线性方程组可以带来大约60%的性能提升。
目前无人机辅助救援物资只能定点投放,但高楼火灾现场环境复杂,气流紊乱,很容易使投放物资偏离目标地点。针对这一局限性,运用电磁连接技术,在无人机下方设计一种自救物资载重箱体小车自动分离的结构,并对箱体小车投放的运动轨迹进行模拟。确保安全准确投放,提高搜救效率,减少人员伤亡。
当前随着电子证据在司法实践中发挥着越来越重要的作用,越来越多的司法证据也以视频、音频、电子文档、图片的形式呈现。传统的电子证据存证系统通常采用中心化的存储方式,通常存在着易受网络攻击、数据易被恶意篡改等因素的影响,增加了电子证据的保全难度。区块链技术具有不可篡改、数据透明、可追溯等特性,正在引领着许多行业的技术变革,为许多传统技术提供新的解决方案。为此设计一种基于区块链技术电子证据存证系统,利用区块链技术和RBAC权限控制保障数据的安全可信,可追溯。
近年来,IIoT(工业物联网)的发展十分迅速,其应用场景也极为丰富,如传感器、机器人、自动化设备等[1]。工业物联网在实际应用中会产生大量的数据,数据的隐私性及安全性是十分重要的。目前,区块链技术被广泛地认为是实现数据安全高效存储/处理/共享的一种有前途的解决方案,但区块链在扩展性、去中心化程度、安全性及延迟上四个方面存在着相互制约。利用深度强化学习可以更好地在上述四个方面实现较好的平衡,使得区块
近年来通过网络爆发的重大舆情事件数量激增,谣言自动检测成为净化网络生态环境的重要研究课题的大背景下,本文主要探讨利用LSTM+Attention深度学习技术对常识类谣言进行自动
存算一体加速器因其高能效和低功耗的特点受到广泛关注,但在神经网络模型与存算一体加速平台之间缺乏高效的自动化映射工具.为了改善这一局面,本文提供一个面向忆阻器存算一
云计算服务安全评估方法一直面临着安全指标覆盖范围小、适用场景有限和指标不易量化的问题,使得云计算服务安全评估工作难以高效开展与实施.本文基于国家标准的要求提出一种
目击证人描述和嫌疑人画像是侦破刑事案件的重要依据,然而尽管人脸识别技术近年来发展迅速,但是根据嫌疑人画像自动识别嫌疑人身份仍然极具挑战。大部分现有素描人脸识别方法或者在特征空间中减小嫌疑人画像与照片之间的模态差异,或者先在嫌疑人图像和照片之间进行转换再进行人脸比对,而都忽略了目击证人对嫌疑人的属性描述。本文提出将人脸属性引入素描与照片间的转换过程,在照片域和素描域中同时进行人脸比对,并融合两者结果
在投影系统中,常常伴随着复杂的物理杂散光效应,从而使投影图像质量受到严重影响。互反射补偿就是为了消除这些杂散光的影响。通过改变输入图像,使投影出的图像和原图一致。这是解决投影图像退化的一个重要但常常被忽视的问题。传统的方法通常通过计算矩阵求逆来解决这个问题。本文首先设计一个深度卷积神经网络,即投影补偿网络(PCN)来学习求逆的过程。PCN由一系列卷积层提取图像特征。此外,在VGG网络上计算特征图的
教学评价信息的采集中难免出现数据缺失的情况,不适当考虑丢失的数据会导致分析结果的偏差。数据填补技术针对不同数据集的填补性能不同,几乎没有填补技术适合所有的数据集。使用fancyImpute和scikit-learn两个免费开源的包库,对包含1000条数据6个属性的教学评价数据集模拟两种缺失机制构建缺失数据集,评估5种方法的填补性能。为了探索正确填补对数据集的影响,我们从scikit-learn中选择有代表性的两种分类器来评估。实验结果表明IterativeImputer算法具有良好的性能。