电视体育比赛音频内容的自动结构化研究

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:www359795792
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的快速发展和网络的蓬勃兴起,人们生活中能够接触到的数字多媒体内容也越来越多。相应地,人们迫切需要新的技术来实现对海量的数字多媒体资源进行有效的管理和检索。音频是多媒体内容的一个重要组成部分,通过对音频的分析可以有效地提取出多媒体内容的语义信息。同视频相比,音频上的处理还具有计算量小的优点。因此,近年以来,基于内容的音频的分段、归类和提取成为了研究热点。 本文主要探讨音频内容提取和管理的一个重要的研究方向:电视体育比赛的音频内容的结构化,即从音频的角度对电视体育比赛的内容结构进行分析。 本文的主要工作和研究包括方面:1.用于电视体育比赛内容分析的音频特征提取:本文提取了MPEG-7标准中的低级音频描述作为特征集,并应用在了电视体育比赛的内容分析中。另外,我们还提取了传统上得到广泛应用的MFCC特征,并通过实验对比了MFCC和MPEG-7特征集在音频内容分析中的性能。 2.电视体育比赛的归类和分段算法的研究:在对电视体育比赛进行按内容归类和分段时,本文利用了SVM算法和图像处理中经常使用的AdaBoost算法。在构造AdaBoost分类器时,本文中提出了一种利用K-L变换和GMM模型构建弱分类器组的方法,并应用在了我们的工作中,收到了良好的效果。 3.电视体育比赛中的事件检测:本文主要分析了欢呼声、哨声和解说员的激动语音这三种体育比赛中常见的音频事件的频谱特征和检测方法,并提出了一种类似于检测基音的哨声的检测方法。 4.基于音频的体育比赛内容分析系统的可移植性的初步研究:由于体育比赛的内容分析中不可避免地应用了相应比赛项目的域知识(高层规则),因此,对于不同的体育项目来说,其内容分析系统是不能通用的。本文中为了增强内容分析系统对不同体育项目的兼容性,就高层规则的规范化输入的形式进行了初步研究。 5.相关领域的研究工作:介绍了作者在相关的领域的研究工作,包括两个项目的工作:音乐的按情绪分类和基于音频的电视新闻节目的主题提取和聚类。
其他文献
学位
数字水印技术是近几年发展起来的新兴的研究领域,目前的研究大多集中于版权保护的稳健水印,也就是具有强鲁棒性的数字水印。同时,数字水印技术还可以用于保密通信领域,并且具有广
北斗二代卫星导航系统于2012年底正式提供亚太区域服务,其北斗三代卫星目前正在组网阶段,预计在2020年正式提供覆盖全球的导航、定位和授时服务。然而,当前阶段,单北斗系统观测卫
本文对IR-UWB技术中存在的问题进行了相应的研究和探讨。文章的主要研究内容包括超宽带信号接收处理优化技术研究和码分多址干扰误码性能分析两个部分,其中第一部分主要考虑针
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
在通信技术发展迅猛的今天,移动通信已经成为人们日常生活中必不可少的一部分。卫星通信是移动通信中重要的一部分,其中天线是卫星通信的一项关键技术。因为受到电离层的法拉第
学位
本文通过对荣华二采区10
期刊
目前,语音识别系统在实验室安静环境下已经达到相当高的识别率,然而当系统工作在背景噪声环境下,由于输入语音受到噪声污染,系统识别性能会急剧下降。噪声鲁棒性问题已经成为语音
对图像进行压缩编码的主要目的是减少图像的数据量,便于存储和传输。在保证图像质量的前提下,尽量压缩数据量是当前图像压缩的重要研究课题。近年来,低速率视频传输的应用更显重