面向说话人识别的语音活动检测与低维向量提取方法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:aerostock
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,说话人识别技术的成熟,使声纹特征作为身份认证的对象,被广泛应用在信息安全领域。实现说话人识别的一个重要前端任务是说话人分割聚类,主要方法是对原始语音进行降噪和分离,并在多人对话场景中分割聚类出属于同一说话人的语音片段。通过将待识别语音段与已知语音段信息对比之后,可以确认该语音段属于某个说话人,从而达到说话人识别的目的。目前已经有不少基于神经网络的说话人识别方法,但识别精度仍然有待提高。本文的主要研究目标是分析基于神经网络的说话人识别关键影响因素及其改进方法。为此,本文首先探究了基于时延神经网络提取低维向量的说话人分割聚类系统,通过实验结果发现改善语音活动检测(Voice Activity Detection,VAD)和边界重分段调整可以降低分割错误率,增强训练数据集和调整神经网络参数会提高系统抗噪性。在接下来的说话人识别系统中,重点探索了基于神经网络的VAD和减弱神经网络过拟合的方法,主要包括:(1)在数据预处理阶段,提出了使用基于卷积神经网络、长短期记忆网络和深度神经网络相结合的神经网络来改进VAD的方法。这种方法使语音同时在频率和时间上建模,实验结果表明有效分割了语音间断点,显著提升了说话人识别率和降低说话人分割错误率。(2)针对说话人分割聚类系统中的神经网络过拟合现象,对神经网络提取低维向量的方法做出改进,通过增加降维层来减少参数规模,并采用跳层连接网络的方式来增强梯度流动。实验结果在两个系统中都得到了验证,与原始神经网络和传统高斯模型的方式相比,分割性能和识别性能都有显著提升。
其他文献
在分析了旅游资源的特点后,结合SOA(Services-oriented architecture)体系结构的理论,提出了一个基于SOA的旅游资源信息服务模型,旨在整合局部乃至区域旅游资源,实现旅游资源的优化配置。在对模型的具体运行机制进行分析时,提出了基于智能代理技术的资源服务代理管理模块,提高了资源管理和使用的效率。最后,为了验证该模型的可行性,建立了一个基于该模型的资源服务平台。
分别在2004年、2005年和2006年洱海鱼腥藻水华暴发时期,分离优势种,获得藻株EH-A、EH-B和EH-C,通过形态学特征和16S rRNA基因序列分析鉴定了藻株的种类。选用藻丝的形态、气囊的
目前,村干部面临着巨大的工作压力,同时基本薪酬较低、绩效考核不够科学,社会保障存在欠缺等薪酬激励机制不健全等问题的存在都是村干部整体工作热情不高、队伍不稳定的重要原因,在社会范围内也引起了群众的不满,进而影响到村内相关事务的正常运行以及乡村振兴战略的全面实施。为有效提升村干部的工作积极性,达到村干部管理的理想效果,提高村干部服务水平和办事效率,让群众有更高的获得感和满意度,构建合理而又行之有效的薪
目的:建立高效液相色谱法检测血清及脑脊液中万古霉素药物浓度的方法。在万古霉素1g静脉滴注每8小时一次联合或未联合腰大池外引流管注射万古霉素20mg每24小时一次这两种不同给药方式下,探索脑脊液中万古霉素药物代谢动力学特征及其相关影响因素,进行万古霉素血清谷浓度、脑脊液谷浓度及临床疗效、安全性、相关影响因素研究,为神经外科中枢神经系统感染患者的用药提供参考。方法:通过确定最佳色谱条件及血液、脑脊液样
本文以中职学生为研究对象,对其人生观塑造问题展开探究。思想品德课从根本上是为培养中职学生健康的人生观、价值观服务的。我们在日常的课堂教学中,透过各种教学内容对中职
分析了电力保护测控装置干扰源的特点,在基于DSP+CPU+CPLD的新型电力综合保护测控系统的具体设计中,提出了软硬件的抗干扰措施,并在实际中的应用中取得了良好效果。
热研7-33-97(Hevea brasiliensis,热研7-33-97)和RRIM600(Hevea brasiliensis,RRIM600)都是大规模推广种植的优良橡胶树品种,对其核型研究在橡胶树育种中有着重要的意义。采用去
针对嵌入式终端的安全问题日益突出以及嵌入式终端信任链传递不完整等问题,结合可信计算的思想,提出了自底向上的和自顶向下的嵌入式可信终端信任链传递模型。基于该模型,以linux嵌入式系统平台为原型,设计了启动可信,操作系统加载可信以及应用程序的加载可信。可以较好地解决目前嵌入式终端面临的安全问题。
代谢网络和生化反应代谢路径的研究是合成生物领域的重要内容,目前亟需相关计算机软件来辅助分析。针对这种情况以及目前移动互联网发展趋势,开发了一种基于Andrmd的代谢网络可
为解决传统标绘系统不能满足用户广域分布、高效并发控制、严格权限管理、即时成果协同、结果高度共享等问题,利用Flex、BlazeDS和互联网GIS服务等技术,设计并实现了地图即时协同标绘系统,介绍其系统体系架构、功能模块,以及标绘权限控制、标绘即时协同、标绘结果共享等关键技术,开发了态势图即时协同标绘系统原型。该系统利用服务器推送方案,避免了HTTP的经常链接,提高了系统稳定性和性能,并降低了带宽压