语谱图在说话人性别与年龄识别

来源 :东华理工大学 | 被引量 : 0次 | 上传用户:evemxy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人性别和年龄识别是自然语言处理技术的一个子领域,是一项具有挑战性的任务,在人机交互系统中通过说话人性别和年龄特征识别,可以实现为特定对象提供个性化服务。随着人机交互系统的深入研究,用户体验的要求越来越高,该技术逐渐在自动语音查询信息、无人超市、健康护理、娱乐等领域得到广泛应用,并且有望在未来持续增长。
  针对语音信号特征提取和建模算法容易受环境噪声影响,性别和年龄识别准确率偏低,年龄识别易出现信息缺失,不能完整表示说话人属性信息等问题,本文提出了语谱图特征结合DeneseNet网络来进行与文本无关的说话人性别和年龄识别的研究思路,并完成以下主要工作:(1)提出一种新型语谱图特征生成算法,通过先分大帧再分小帧的方法增加语谱图生成数量,使得语谱图包含更全面的说话人信息,且通过算法提取语音信号背景噪声和无声段生成语谱图,作为系统特征输入图,经测试,以上算法在系统抗噪能力和准确性方面都得到了有效提升;(2)基于DeneseNet网络结构构建了性别和年龄的语音识别算法模型,通过对激励函数和分类函数的优化匹配,改善了小数据集上存在的过拟合问题,深度网络梯度消失问题,加强了跨层深度卷积的效果,降低了对于特征图数量的需求,在节约系统计算资源的同时,很好的提高了系统识别率;(3)确定了语谱图帧长、学习率、网络结构参数、迭代次数等对系统识别率的影响规律,并完成参数的最优配置。
  基于以上研究结果完成了在线说话人识别系统设计,基于python3.10与Tensorfolw1.14.0实验平台,经采用不同语音库进行检验,说话人性别识别率总体达到了99%,年龄识别率总体达到88.6%,性别和年龄同时识别的准确率达到90%,单个说话人性别和年龄识别可在两秒内完成。
其他文献
因能源危机与环境污染问题的日益严峻,电动汽车近些年来得到了快速发展。作为电动汽车的动力源,锂离子动力电池成为制约电动汽车快速发展的主要因素之一。热性能不仅对锂离子电池的使用性能、寿命有直接影响,也关乎着整车的安全性。为满足电动汽车使用性能的需求,常常将多颗单体电池通过串并联形成电池组,在这种情况下单体电池之间的不一致性会导致电池组的性能、寿命下降,同时也影响着电池的热安全。因此,对锂离子电池的热性
学位
燃料电池技术是一种清洁高效的能源转换技术,水管理是影响质子交换膜燃料电池(Proton Exchange Membrane Fuel Cell,PEMFC)工作性能以及工作效率的关键技术,是目前国内外研究热点。PEMFC中的阴极流道存在较为复杂的水淹问题,需要从机理层面分析解决。本文利用VOF(Volume Of Fluid)模型对液态水在电池流道内的气液两相流动问题进行深入的模拟研究,同时在常规
该文介绍了废水处理的发展情况;总结了焦化废水的处理方法,并比较了其优缺点,提出了其适用场合;比较了焦化废水生物脱氮的常用工艺,详细阐述了硝化-反硝化原理及其影响的因素.试验表明,该工艺系统处理含高浓度NH-N的焦化废水技术可靠、经济可行.控制进水NH-N、COD浓度分别在500~600mg/L和2000mg/L左右,通过加强絮凝沉淀作用,出水完全可以达到排放标准,其运行成本为3.60~4.36元/
学位
该文在一台TY1100轻型直喷式柴油机的基础上,研究了碳酸二甲楷(DMC)作为含氧燃料添加剂对柴油机性能、排放和燃烧特性的影响.论述了同时使用碳酸二甲酯(DMC)作含氧燃料添加剂和采用排气再循环(EGR),来降直喷式柴油机氮氧化物和碳烟/微粒排放的试验研究.
学位
现代社会信息化的程度日益加深,无线通信已广泛应用于生活和工作的各个领域。用于实现探测与定位作用的天线则是无线通信系统的核心,天线的性能优良直接关系到信息是否能及时有效的传达。因此,如何能够使得天线具有更高的增益、更好的定向性,并且能够性能稳定、易于与其他器件集成成为了天线设计者关注的重点。全息天线有着区别于传统天线和天线阵列的设计和实现形式,具有低轮廓、构建形式灵活的特点,对馈源天线的要求低,馈电
学位
随着新能源技术的发展,逆变器系统越来越广泛地应用于诸多领域,而其中存在大量的开关器件以及反馈控制,使其成为一种典型的强非线性系统。非线性系统在特定参数或外界干扰下可能出现如倍周期分岔、混沌和次谐波振荡等丰富的非线性现象,对逆变器系统的稳定性和安全性造成严重影响。因此,有必要对逆变器系统中出现的非线性动力学行为进行研究,为使系统工作于稳定状态提供一定的指导。论文的研究主要包括以下几点:  (1)对采
学位
测井是矿产资源勘探与开发的重要方法技术,在保障国家矿产资源储备中发挥重要作用。在测井工作中,井上井下需要高速准确通讯,同时井下仪器设备需要井上提供电源。目前的测井通讯系统普遍需要使用多芯电缆来分别实现数据通讯与设备供电。测井电缆长度一般在几百米到几千米之间,这种方式不仅增加电缆的成本还大幅加大电缆的重量体积,给测井仪器的装卸和运输带来困难。目前有些测井探管(如自然伽马总量测井仪)为了追求简单、易用
人体行为识别作为计算机视觉领域的重要分支,受到国内外研究学者的广泛关注,在智能监控、医疗健康等领域具有重要的应用价值并取得了重要进展。随着技术的全面应用,新的问题也不断出现,本文针对其中复杂场景下运动人体目标难以完整提取,人体行为特征难以精确刻画的问题展开研究。  针对运动目标在复杂和多变的活动场景中检测困难的问题,构建改进型混合高斯模型运动目标检测方法:通过自适应调整模型的高斯分布数量,提高运算
砷化镓(GaAs)核辐射探测器自上世纪70年代发展至今,探测器已有较好的制备工艺及探测性能,但GaAs探测器在耐辐照、辐照损伤修复及低功耗等方面的研究却很少,并且一些特殊环境的应用领域对探测器的性能提出更高要求,这些不足都制约其进一步的发展。本文围绕GaAs基核辐射探测器的制备及性能表征、耐辐照性、辐照损伤修复等方面展开了研究。  设计并制备了半绝缘GaAs肖特基型探测器,测试了其电学特性,在偏压
学位
振动式物位检测装置是一种利用压电振动效应原理制成的新型物位传感器,因其能解决在蒸汽、粉尘、泡沫和电磁干扰等恶劣环境下一般仪表无法使用的难题,且在品质、价格上受用户青睐。本文对振动式物位检测装置行业发展状况、课题研究意义及目前存在问题进行了简述,介绍了压电悬臂梁及振动学有关理论基础。  文章基于振动测量基本原理,设计了一种以直棒探头为感知元件的检测系统总体技术方案,并对系统的硬件电路和软件程序进行详