DenseNet在声纹识别中的应用研究

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:zhangyongqiangis250
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高声纹识别技术的识别性能,将DenseNet应用于语谱图实现声纹识别,从提高网络的运算效率和增强声纹特征的表征能力2个方面对DenseNet进行优化,提出采用深度可分离卷积来减少网络的参数量,以及增加中心损失函数项来提高声纹特征的表征能力.从训练结果可以看出,通过深度可分离卷积,网络的参数量减少了25.5%,模型大小减少了24.6%;从仿真结果可以看出,中心损失项的增加使声纹特征的聚类效果更加明显,提高了声纹特征的表征能力.因此,改进后的DenseNet在语谱图声纹识别领域取得了好的识别效果.
其他文献
忆阻器可以将信息存储和逻辑运算整合到一个电子器件上,这将打破传统的冯·诺依曼计算机架构,其应用前景不可估量.首先简述了忆阻器的发展历程及其基本概念;其次综述了忆阻器的阻变机制及其材料的选择,将目前已知的阻变机制主要概括为3类,即阴离子阻变机制、阳离子阻变机制和纯电子机制,同时详细叙述了不同类型材料在忆阻器应用中的特点;然后论述了忆阻器在布尔逻辑计算以及神经形态系统方面的应用;最后展望了忆阻器未来的发展方向并总结了其在实际研究中仍未很好解决的难题.
手机电脑平板等的普及,使得照片在日常生活中更容易获得,并且人们习惯将大量照片存储在云端.但是,在享受云存储带来的便利的同时,用户也容易受到隐私泄露的威胁.虽然学者们设计出许多图像加密方案用来防止隐私泄露,然而往往忽略了图像的可用性.最近,T ajik等人提出了一种精确缩略图保持的加密方案,能够很好地平衡图像的隐私与可用性.但是,该方案在加密过程中仅以2个像素为一组,效率较低.为此提出一种利用分割法加密图像的方案,该方案以3个像素为一组进行加密,用于保持密文图像的缩略图与明文图像的缩略图一致,并且该方案相比
智能手机拍摄的图像中经常会出现变形的文档图像,变形的文档图像影响文本的识别和后期图像处理等工作,而现有的变形文档图像校正方法存在校正类型单一和校正效果不理想的问题.针对以上问题,提出了一种基于最小化重投影的变形文档图像校正方法.该方法首先通过文本域轮廓检测,合并文本域轮廓来获取文本行连通域.然后利用主成分分析法PCA在行连通域生成文本关键点.最后通过最小化关键点和其投影点之间的距离获取重采样参数,再对变形的页面进行最小化重投影来进行文档图像校正.校正后识别率得到有效提高,相比现有方法,所提方法取得了更好的
随着智能设备的不断出现,图像数量急速增加,但是很多图像因为没有被标注所以未被充分利用.为了能够使该问题得到较好解决,提出了基于LDA和卷积神经网络的半监督图像标注方法.首先把图像训练集中的所有文字信息放入LDA中,生成图像的文字标注词;然后使用卷积神经网络获得图像的高层视觉特征,同时用加入注意力机制和修改损失函数的方法来对卷积神经网络进行优化;接着把LDA生成的标注词和已获得的图像的高层视觉特征进行结合并同时使用半监督学习来完成模型的训练;最后把标注词间的相关性和使用最终模型预测的结果相结合来完成图像的最
在网速飞速提升、内存瓶颈突出、网络处理开销愈发显著的时代,普通网卡在网络协议处理、数据搬移、使用灵活性等方面逐渐暴露出缺陷.智能网卡,作为可编程的智能网络设备,在数据中心、科学计算领域均得到广泛关注,成为解决网络瓶颈的关键技术.在网络协议处理卸载、网络功能虚拟化、特定应用加速等应用场景中发挥着重要作用.综述从智能网卡的基础架构、编程框架、应用方向和热点问题4个方面进行分析,总结了目前产业界中的典型产品、学术界中的重要成果,明确了不同设计架构的优势和不足,分析了不同编程框架适用的应用场景,介绍了智能网卡在典
对图像局部进行风格迁移通常会导致风格溢出和较小的区域风格化后效果不明显,针对该问题,提出一种图像显著性区域风格迁移方法.首先,根据人眼视觉注意机制的特点,对训练图像数据集中的显著性区域进行标注,采用快速语义分割模型进行训练,得出包含图像显著性区域的二值掩码图.然后,通过精简快速神经风格迁移模型网络层结构,并在生成网络部分采用实例正则化层,得出更具真实感的整体风格迁移结果.最后,将由语义分割得到的二值掩码图和整体风格迁移图相融合,输出最终的结果图像.在Cityscapes数据集和Microsoft COCO
为了解决樽海鞘群算法SSA在寻优过程中存在收敛速度慢、计算精度差等问题,提出一种新型的樽海鞘群算法NSSA.首先分析SSA中樽海鞘在追随领导者过程中的不足,然后借鉴灰狼优化算法中追随头狼的思想来改进樽海鞘追随领导者的方式.在23个基准函数上对NSSA与其他算法进行性能比较,并把该算法应用于图像匹配之中.所有实验结果表明,NSSA具有更好的收敛速度、计算精度和鲁棒性.
近年来,随着摩尔定律逼近极限,片上系统(system on chip,SoC)的发展已经遇到瓶颈.集成更多的功能单元和更大的片上存储使得芯片面积急剧增大,导致芯片良品率降低,进而增加了成本.各大研究机构和芯片制造厂商开始寻求使用先进的连接和封装技术,将原先的芯片拆成多个体积更小、产量更高且更具成本效益的小芯片(Chiplet)再封装起来,这种封装技术类似于芯片的系统级封装(system in package,SiP).目前Chiplet的封装方式没有统一的标准,可行的方案有通过硅桥进行芯片的拼接或是通过中
流数据作为一种新型数据,在各个领域均有应用,其快速、大量及持续不断的特点使得单遍精准扫描成为在线学习算法的必备特质.在流数据不断产生过程中,往往会发生概念漂移,目前对于概念漂移节点检测的研究相对成熟,然而实际问题中学习环境因素朝不同方向发展往往会导致流数据中概念漂移类别的多样性,这给流数据挖掘及在线学习带来了新的挑战.针对这个问题,提出一种基于时序窗口的概念漂移类别检测(concept drift class detection based on time window,CD-TW)方法.该方法借助栈和队
传统的缓存替换策略主要基于经验主义,近年来研究者们使用预测技术推测访存行为,提高缓存替换的准确性,预测技术的应用是当前缓存替换策略研究的热点.由于访存行为自身的复杂性,直接在缓存系统中预测访存行为是困难的,要面对很大的不确定性.当前已有的研究为了解决该问题,使用越来越复杂的预测算法来分析访存行为之间的关联.然而这种方式并未真正减小不确定性,同时现有的缓存替换策略很难避免乱序执行和缓存预取对访存行为分析过程的干扰.为了解决以上问题,提出了一种新的预测缓存访问序列的方法IFAPP(instruction fl