梅尔频率倒谱系数相关论文
近年来,国家生猪养殖业的经济发展方式正在向集约化养殖的方向发展,在生猪养殖业集约化发展的同时,猪的呼吸道疾病已经成为养猪场......
为了及时发现并定位咳嗽生猪,从而预防生猪呼吸道传染疾病的传播,试验设计了一种可以对生猪咳嗽声进行识别并定位的方法。首先通过......
针对英语口音识别问题,首先基于梅尔频率倒谱系数(Mel-frequency cepstral coefficients, MFCCs),以卷积神经网络(convolutional neura......
心音分析对先心病早期诊断具有重要意义。本文不依赖分割心动周期,提出一种基于费希尔判别升半正弦函数(F-HRSF)改进的梅尔频率倒谱系......
梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)是一种符合人耳听觉特征,并与频率呈非线性对应关系的频谱特征,广泛应用......
火电厂电力设备声音包含了丰富的有效信息,但受限于复杂环境噪声,使得有效特征提取极其困难。为解决这一问题,文章提出一种基于GFCC-S......
猪只呼吸道疾病易传染,影响猪的养殖生产效率,咳嗽是呼吸道疾病的显著症状之一,为识别猪只咳嗽声,提出了一种基于深度神经网络的识别方......
针对球磨机在粉磨作业过程中,交替出现的空磨、正常磨和饱磨3种工作状态,而球磨机磨音信号特征复杂,单一特征提取方法不能较好地识......
自动语音识别是将语音序列转换为文本序列,是实现人机交互的关键技术。当前,随着人工智能的发展,汉语、英语、日语等主流语言的研......
“无监督”身份认证的时代已经到来,快速准确便捷的实现身份认证,不仅能够方便人们的生活,还能保障个人权益。以往常见的身份认证......
近年来,越来越多的语音识别应用进入到大家的日常生活中,其中关键词识别是语音识别应用领域必不可少的关键技术之一,而这些应用设......
咳嗽是猪患呼吸道系统疾病发病早期的主要症状.为解决猪呼吸系统疾病难以被发现和人工监测准确率低的问题,提出利用BP神经网络来检......
为进一步提高说话人识别的准确率,提出一种新的基于卷积神经网络的说话人识别方法.利用卷积神经网络强大的处理图像能力可有效提高......
近年来,随着物联网与智能语音技术的发展,语音交互逐渐成为主流的人机交互方式。为了满足常开且实时响应的语音识别交互,需要将语......
语音端点检测是一种从掺杂有背景噪声的语音信号中区分出语音和非语音信号的技术,它直接影响着语音识别、语音增强等语音处理技术......
基于神经网络的语音增强算法相比于传统方法具有更好的语音增强效果,但因网络规模大导致其难以实时实施于助听器中.对此,本文提出......
鸟类的频繁活动严重影响输电线路的安全运行,为实现涉鸟故障的差异化防治,提出了一种基于鸣声信号Mel频率倒谱系数(MFCC)和高斯混......
为通过噪声检测及时发现车辆行驶过程中突发的异常,提出基于隐马尔可夫(HMM)的评估方式。通过选取车辆正常以及异常状态下的噪声采......
为了探索机电设备潜在声发射(AE)故障的有效预测方法,提出了融合梅尔频率倒谱系数(MFCC)与信号典型时频特征用于支持向量机(SVM)模......
通过语音实现疲劳度检测具有操作简单、无创伤和实时性等优点.为了提高语音疲劳度检测的性能,将韵律特征与动态倒谱特征相融合,采......
为提高传统MFCC等声学特征及深度卷积神经网络的识别性能和对背景噪声的适应性,提出基于改进MFCC特征和改进RCNN网络的说话人识别......
针对文本图像特征有时无法满足对物体材质进行真实准确分析的情况,本文在视听领域使用跨模态检索方法进行表面材质检索。首先提取......
针对传统音乐流派分类模型性能不稳定、音乐信号特征单一导致分类准确率低的问题,提出了改进的BP神经网络(Back Propagation Neura......
感知音频编码是多媒体产业的一项重要技术。在过去数十年间,为了满足数字音频的高效传输和存储需求,多种压缩率高、编码质量优良的感......
说话人识别作为生物识别的一种,应用范围非常的广泛,是依据语音波形中所反映的说话人生理及行为的语音特征参数,以此来自动鉴别说......
随着人们精神文化的丰富,许多娱乐节目也应时而生,而娱乐节目中的评分环节也是不可或缺的一部分。目前评分方法大多是现场的权威评委......
随着技术的飞速发展,智能人机交互逐渐进入了人们的生活之中,很多电器的控制面板中都加入了声音信息的人机交互,其中大多数都具有......
低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高......
近年来,随着人工智能的发展,运用神经网络进行图像分类和文本分析已经取得了成功,在声音信息检索领域,神经网络同样能够进行语音识......
声纹识别也被称为说话人识别,是利用计算机技术及其他信息技术对声纹进行辨认从而对说话人的身份进行匹配的生物特征识别技术。声......
将正弦注意力表征网络引入环境声音识别,首先提取梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)作为音频识别特征,......
压缩气体在纺织、化工生产、生物制药、航空航天等领域发挥着重要的作用,被誉为“第四类资源”。由于腐蚀、老化以及人为破坏所引......
语音是最直接、最自然的人机交互方式之一,说话人识别正是一种依据人的语音信息区分说话人,从而实现身份认证的的生物特征识别技术......
为了进一步提高综采放顶煤过程中煤矸识别分类准确率,提出了一种基于一维卷积的煤矸声音特征融合分类方法.首先提取放煤过程煤矸垮......
近几年各大音乐平台内优秀原创歌曲不断涌现,歌曲之间的相似性与抄袭的争议也引起了越来越多的关注。对于歌曲相似性的研究可以为......
大量非饱和状态的水工混凝土结构部分或全部表面都在与水接触的环境条件下服役,极端暴雨天气也使得混凝土构件经常在短期有水的环......
利用语音障碍进行帕金森病检测是目前帕金森病早期诊断的研究热点之一。近年来基于深度学习的语音障碍检测发展迅速,且检测正确率......
近年来,人工智能的快速发展刺激着科技的不断进步。人工智能领域内的图像、语音、文字三个重要领域内的研究也随着人工智能技术的......
病理语音是发声系统异常所产生的语音,可由多种疾病引起,其中构音障碍是由于神经病变导致发音器官出现肌肉功能减弱或不协调的一种......
环境声音分类和声纹辨识均属于音频信息处理范畴。环境声音分类是应用信号处理、计算机及人工智能等技术对特定环境声音信号进行分......
随着数字多媒体技术的快速发展,语音信号凭借自身占用空间小、易于编辑和传输等优点成为人们日常生活沟通的一种重要方式。由于语......
使用违法鸣笛辅助执法设备监测城市交通中汽车鸣喇叭事件的发生,可以有效地治理扰民的喇叭噪声,汽车鸣喇叭声的识别方法是其关键.......
针对现有语音情绪识别方法特征提取完整性和准确率较差的问题,将注意力机制和长短时记忆网络(Long short-term memory,LSTM)相结合......
语音是人类交流与沟通的最主要方式之一。随着语音技术的进步,手机、掌上电脑等逐渐被人们所熟知,无线通信及网络的普及,语音产品担任......
在通过对MFCC算法的研究和实验,发现在噪音环境下基于梅尔频率倒谱系数(MFCC)的识别率受到了影响.为了提高在噪音环境下说话人识别......
现有说话人识别系统对环境噪声及说话人声音变迁等干扰的鲁棒性较差.为此,在改进和优化高斯混合-通用背景模型的基础上,根据家庭环......
针对信号识别率高低由识别模型及特征参数决定的特点,提出融合K均值聚类的多观察序列的Baum-Welch参数重估算法,用于训练隐马尔科......