音频分类相关论文
音频分类问题一直是研究的热点和难点,解决这个难点的一个有效的方法就是卷积神经网络,但是大多数优秀的卷积神经网络都是应用于图......
梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)是一种符合人耳听觉特征,并与频率呈非线性对应关系的频谱特征,广泛应用......
物联网的音频技术正处在飞速发展时期,它也渐渐开始改变人们的生活习惯和生存方式,如何更好地对现有的大量音频数据资源进行分类是......
音频场景分类是对音频数据的识别和分类,即识别判断所记录声音的环境标签,可以应用于音频监控、异常发现和风险防控等多种安防监听......
音频是信息的重要载体,针对音频信号处理的研究具有广泛的应用价值。深度学习方法能够自动从海量数据中高效的提取任务相关特征,在......
随着互联网在全球的普及和5G网络在中国大范围的建设,更全面的网络覆盖使得网络活动更便捷的同时也带来更大信息泄露的风险。投机......
本文介绍了一种自动音频分类和分段方法.算法分成两个步骤:首先,使用音频分析的方法将新闻节目的音频分类成静音、语音和音乐,切分......
音频分类是音频分析中的一项基本任务,它为基于内容的音频检索做准备.目前对音频分类方法的研究有很多.音频特征分析和抽取是音频......
本文根据当前江苏广播广告的类型和播出流程,针对广告播后检测的需求设计了一个基于人工智能的广告自台监播系统,系统基于音频声纹......
音频信号处理在家庭活动识别、监控系统等领域变得越来越重要。目前大部分音频信号处理问题都使用深度学习方法。深度学习方法中最......
随着计算机速度、容量的提高,以及互联网上音频数据的急剧膨胀,发展音频信息的基于内容检索技术已经成为迫切的需要。音频信息的基于......
支持向量机是上世纪九十年代提出的一种基于小样本的新的统计学习方法。本论文通过引入一种新的基于支持向量机的多类分类方法来解......
在当今的数字信息时代,多媒体信息处理技术的日益成熟,计算机处理能力和网络速度的快速提高,使包含了图像、视频、音频等越来越多......
随着计算机技术、网络技术和通讯技术的不断发展,图像、视频、音频等多媒体数据已逐渐成为信息处理领域中主要的信息媒体形式,其中......
多语言语种识别(LID)技术在多语种语音信息服务,多语言语音识别系统、多语言语音翻译系统和多语种广播节目监控系统中都起着很重要......
随着大数据时代的发展,音频内容分析对海量数据的存储和利用有着越来越重要的作用,但目前存在的声学特征已经无法很好地表征日渐复杂......
声音感知技术作为人机接口的一个重要分支,对提高计算机的自动化和智能化程度具有重要的意义.它的特点是能够利用机器自动感知周围......
随着网络的发展、信息技术的进步,人们能够处理的音频信息量越来越大、音频信息的种类越来越繁多,从这海量的音频数据中迅速、有效......
音频作为多媒体信息的一个重要组成部分,承载着很多资讯。随着多媒体技术的发展,音频资料的数据量不断膨胀。为了有效地利用这些信息......
新闻广播语料自动标注技术的研究对于建立大规模语音语料库、语音识别技术、音频检索技术的发展都有重要意义.新闻广播语料的自动......
足球比赛是大众普遍喜爱的一种体育运动,每年都有许多的足球比赛电视转播。一场足球比赛通常在90分钟以上,由于视频媒体的时序性和无......
多媒体技术以及网络技术的迅速发展,使得人们拥有和面对的多媒体信息的数据量急剧增多。伴随着近年来移动互联网的迅猛崛起,大数据时......
本文在对声音信号采集、特征提取以及场景分类技术等理论全面分析的基础上,提出了一系列新的时域特征提取方法如帧内平均峰值能量......
视频、图像和音频等多媒体数据已经成为信息处理领域的主要信息媒体,其中音频占有很重要地地位。传统的基于文本的检索存在主观性和......
近年来随着多媒体数据成数量级的增长,对于多媒体的分析和分类变得越来越迫切。当人们阅读和理解视/音频内容时,作为多媒体数据中重......
近年来,随着数字音乐创作、收集以及存储技术的快速发展,许多机构积累了大量的音乐音频数据。随着英特网多媒体资料的蓬勃发展,如......
提出了一种针对竹笛技巧分类的数据集Breath和两个用于竹笛技巧分类的神经网络参考模型Breath1d和Breath2d,并针对此数据集的不同......
随着多媒体和互联网技术的不断进步与发展,音频信号作为多媒体信号的重要组成成分,对其进行信息处理与挖掘受到越来越多研究者的青......
音频分类(audio classification)是计算机听觉相关研究的主要方向之一,需要根据声音的内在特点对不同声源进行分类。随着深度学习......
如今机器学习技术发展迅速,已经应用到了许多领域并且也取得了十分优秀的成绩,但不断增加的实际需求对机器学习提出了更高的要求。......
本文结合广播质量评估实际业务需求,深入研究了广播质量评估中如何对广播语音的质量进行客观评价,实现了一种融合音频分类、信噪比......
音频作为多媒体信息的重要载体之一,有效地丰富和补充了人们对信息的感知和获取.但目前常规的多媒体信息检索技术仍以视觉信息......
随着计算机速度、容量的提高,以及互联网上音频数据的急剧膨胀,发展音频信息的基于内容检索技术已经成为迫切的需要。音频信息的基于......
随着计算机网络和多媒体技术的迅猛发展,数字视频在人们的生活中成为不可或缺的信息载体。但是在这些视频中,还夹杂着一些不良内容......
音频处理在多媒体信息处理中占有重要地位。原始音频数据是一种非语义符号表示和非结构化的二进制流,如何提取音频中的结构化信息和......
随着计算机技术、网络技术和通讯技术的不断发展,音频数据量飞速增长,对海量音频数掘库进行分析、处理和检索就显得尤为必要,而基于音......
本论文研究了压缩音频处理及应用的重要课题,通过对压缩音频处理的研究目的、研究意义和主要方法进行讨论,对国内外研究现状进行综述......
音频处理在多媒体信息处理中占有重要地位。原始音频数据是一种非语义符号表示和非结构化的二进制流,如何提取音频中的内容语义和......
提出了一种把音频片段分类成语音或音乐的新系统.系统能自动选取在相应的信噪比下具有最高分类精度的特征参数.将从音频片段提取的......
为了缓解广场舞大妈与附近居民的矛盾,本文利用平方余数序列扩散体,采用复合再生木吸声材料,设计了一种彩灯声屏障,该彩灯声屏障既......
采用同一种特征参数--Mel倒谱系数及其动态参数区分纯语音、带背景语音、乐器音、歌声和环境音.根据该特征参数的特点以及各类音频......
水声目标识别的任务是通过采集到水声目标的信号来对目标进行分类,在海洋勘探,监听技术等领域有着非常重要和广泛的应用.由于海洋......
为解决单一语音、音乐音频及其两者的混合音频进行语音/音乐分类时分类结果不准确的问题,提出一种基于音频分割的音频分类算法。利......
海洋声场环境的时变空变特性、水声目标发声机理的多源性以及其他噪声源的干扰,给水声目标的检测和识别带来很多困难.常规的目标识......
传统的基于文本的音频检索技术存在主观性和不完整性等缺点,而且不支持实时音频检索.为此,基于内容的音频检索技术应运而生.文中根......