基于神经网络的声音识别算法研究

被引量 : 10次 | 上传用户:andychinajj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,无论在工业生产还是日常生活环境中都充斥着大量的多媒体数据,而声音作为多媒体数据中的重要组成部分蕴含了大量的信息。对声音数据进行处理和分析可以从大量的数据中挖掘出对我们有用的信息,因此针对声音的处理和分析技术一直以来都是各国学者深入研究的热点。其中声音识别技术近些年来也得到了大量的关注和应用。声音识别是将待识别声音的特征与声音样本特征进行比对,从而得到待测声音和样本的一致性判断。声音识别可应用于许多领域和场合,如环境声音异常监测、音频资料检索、音频媒体版权监测等。在对声音进行识别之前先需要对其进行前期处理,声音识别前期的处理流程包括预加重、分帧加窗和端点检测等。在前期处理的基础上,对声音进行特征提取得到声音的特征向量。接着是模式匹配阶段,通过模式匹配得到声音识别的最终结果。基于神经网络的基本工作原理,本文主要研究了如何应用神经网络解决多类声音识别中的模式匹配问题。本论文的主要工作如下:1,在介绍了神经网络基础知识的基础上,针对两类识别网络的具体参数进行了研究探讨,确定了传输函数、神经元和神经层个数等多个参数。2,探讨了多类声音识别的识别方案,对线型识别、并行排名、两类晋级三种不同的识别方案进行对比论证,确定了以两类晋级识别为基础的多类声音识别方案。3,详细阐述了运用两类识别神经网络对多类声音进行识别的方法。对多组竞争方法和可信率进行了全面的阐述,通过多组竞争的方法可以大幅提高两类神经网络的识别率,具体实例验证了多组竞争方法在多类识别中的效用。将可信率的计算应用到识别程序中可以让用户主动掌握识别进程,得到在识别时间和识别率之间权衡后满意的识别结果。4,针对声音类别总数是任意数的情况,论述了分组匹配竞争方法。通过多个具体实例讨论了分组匹配识别方法的基本规律,总结了类别数十以内的声音识别推荐分组模型,类别数更大的问题可以通过先分组到十以内的小组来解决。
其他文献
优质稻由于其特殊的生理特性和结构特点,极易发生品质劣变,不耐储存。本实验采用充氮气调储藏技术对稻谷保鲜进行研究,定期测定发芽率、电导率、直链淀粉、胶稠度、糊化特性、α
微拟球藻(Nannochloropsis ganada)在物种分类上被划归为褐藻门、大眼藻纲、单细胞藻类。其油脂含量最高可达占干重的60%左右,脂肪酸组成主要为C16和C18类。该藻被学者认为是
目的:本研究旨在通过全转录组测序技术(RNA sequencing,RNA-se q)在全基因表达谱范围内寻找所有和TB-IRIS(Tuberculosis-associated I mmune Reconstitution Inflammatory Sy
21世纪是质量的世纪,质量就是竞争力。在全球聚焦的气候变化、旅游危机事件、日益加剧的资源、环境和社会承载压力的大背景下,中国旅游面临的发展问题日益凸显。全面提升旅游
目的:评价β2-微球蛋白(B2M)作为预测人类免疫缺陷病毒(HIV)感染者病情进展及抗逆转录病毒治疗(HAART)效果评估标志物的价值。方法:3 145例标本分为4组,分别按试剂盒操作说明
本文以湖北大米为原料,制备超微大米粉,并对不同粒径大米粉的颗粒形貌、糊化特性、热特性以及其他理化性质进行比较研究。这对研究大米的深加工,提高稻米的利用率和附加值具有重
为了解伊犁地区马肉肉用品质和营养成分的特点,本研究以伊犁地区马匹肌肉为研究对象,对主要肉用品质指标和部分营养指标进行测定。并对数据进行整理分析,综合评定伊犁地区的杂交
本次研究来源于导师横向课题,以家用护理床为设计平台,以用户为出发点,通过模块化设计理论的指导,以期对现有的护理床进行结构上的创新和功能上的改进,从而大大提升家用护理床的适
根据我国《刑法》的规定,寻衅滋事罪,是指随意殴打他人,追逐、拦截、辱骂、恐吓他人,强拿硬要或者任意损毁、占用公私财物,在公共场所起哄闹事,情节严重的行为。虽然新颁布的《最高
<正>随着年轻一代消费者观念的变化,婚纱影楼遭遇了前所未有的发展瓶颈。经济的发达唤醒的不光是消费者对奢华的追求,同时唤醒了消费者对个性的向往。照片的本质是记录、保存