基于深度置信网络的说话人识别研究与实现

被引量 : 0次 | 上传用户:guihuxinxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,在越来越多的领域内都应用了语音信号处理技术,其中一个重要分支为说话人识别技术,它是目前语音信号处理技术领域中的一个研究热点。说话人识别是对说话人身份进行认证的一种技术,包括语音录入、预处理、特征提取、模型训练以及模式匹配,它是通过从经过预处理后的语音中获取语音特征进行模型训练与模式匹配从而确定说话人身份。从该过程可知特征提取是其他步骤的基础,它是说话人识别中最重要的一个环节,因此本文分析了特征提取方法的优缺点并提出了一种基于改进参数设置的深度置信网络的特征提取算法。影响特征提取的因素有很多,其中噪声是最为直接的因素,从而必须在特征提取前对语音进行滤波操作,因此本文也分析语音滤波方法的优缺点并提出一种多层自适应形态滤波算法,并且以此为基础设计实现一个说话人识别的原型系统。本文的主要工作为:(1)归纳了语音滤波算法和特征提取算法的特点和难点,对比分析了目前常用的语音滤波算法和特征提取算法的优缺点。(2)现有的大多滤波算法在进行语音滤波时损失了较多的纯净语音信号从而使得语音质量下降,利用形态滤波算法进行滤波时既可以很好的滤除语音中的噪音同时也可以减少纯净语音信号的损失,然而现有形态滤波算法还存在结构固定、预设结构元素和偏倚校正系数等问题,针对该问题,提出一种多层自适应形态滤波算法。该算法面对复杂变化的噪声时,可以灵活选择不同的结构元素、优化设置偏倚校正系数向量来减弱形态开运算和形态闭运算所带来的偏倚现象。仿真结果表明该算法改善了形态滤波的性能,具有设计简单、实用性强的特点。(3)现有的特征提取方法中对初始特征的处理大多是进行简单的组合、微分、筛选或加权等,所提取特征表征能力较弱,用其进行说话人识别时正确率较低。针对此问题,将深度置信网络用于特征提取并对其参数的设置进行改进使得所提取特征具有更强表征能力。仿真结果表明该算法所提取的特征能有效的降低说话人识别的误识率。(4)对说话人识别原型系统的需求进行了分析,根据说话人识别的处理流程进行了功能划分,并给出了说话人识别的系统结构,对其中的核心模块进行了详细设计并予以实现,最后对系统的功能和性能进行了测试并对测试结果进行了相应的分析。
其他文献
<正>麦克尔·菲尔普斯是天生的"飞鱼",但不是一只普通的"飞鱼"。身体、心理、意志品质、遗传因素、家庭传统、环境因素等的完美结合,促使他成为史无前例、独一无二的游泳运动
预期违约制度是合同法中违约制度的重要组成部分,源于英美法,我国《合同法》吸收和借鉴了这一制度。本文从关于预期违约的现行法律规定出发,着眼于预期违约的起源与发展,对其
二战后,作为史学分支的城市史开始在欧美国家出现,并逐渐扩及全球。英国有关城市历史的著述很早就有,但作为一门学科的城市史却是在1960年代才产生的,其中J.H.迪奥斯发挥了十
"人性恶"是世界文化母题之一,戈尔丁的寓言式经典巨著《蝇王》与芥川龙之介的短篇精品《罗生门》都不约而同揭露了"人性恶"。两位作家由于位于东西方,他们的个人经历,写作背
提出了将米糠作为人类食品原料的课题,介绍了用米糠制作精制"米糠即食粉"、"谷维醇速溶饮品"的方法,对开发研究米糠食品有相当的参考意义。
<正>会展设计是展览业一个重要工作的组成部分,他通过展区空间规划、展位造型、展台装饰、展品包装以及图文、色彩、灯光、平面与多媒体的设计手段,作为企业和产品对外宣传最
在全球经济一体化的今天,高技术经济正在迅速发展,科学技术已经成为第一生产力。产业创新联盟的组建成为了建设创新型国家的关键,也是应对国外产业技术竞争的重要手段。通过