基于音视频融合的网球视频检索

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:randomx1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以网球视频为研究对象,检测网球比赛视频中出现的精彩事件,如ACE球、上网球等。并提出了一个网球视频精彩事件检测框架,实现了视频流语义分析、音频流语义分析和音视频特征融合的精彩事件检测三个部分。视频流语义分析包括镜头分类、球员检测、球员跟踪等。镜头分类是网球比赛视频分析的基础,直接决定精彩事件检测的准确性。针对目前现有的镜头分类方法,结合网球比赛视频的特点,提出了一种基于Hough直线检测的镜头分类方法,将镜头分为比赛镜头和非比赛镜头。然后在比赛镜头中利用帧差法提取球员所在位置区域,利用Camshift算法实现球员跟踪。音频流语义分析包括基于帧的特征提取及基于段的音频分类等。本文先将音频流分段,再对音频段分帧处理,然后提取音频帧的特征参数,包括短时平均能量、短时过零率、MFCC以及差分MFCC等,利用连续隐马尔可夫模型实现对音频段的分类,将音频段分为击球声、欢呼声、解说员激昂解说、解说员平缓解说、背景噪音等五个类别。最后通过比赛镜头的长度、球员位置、球员运动变化、击球声和欢呼声等特征检测出ACE球事件、底线对打事件和上网球事件。综上所述,本文采用音视频融合的方法实现了网球比赛精彩事件自动分析与提取。最后,本文以Visual C++ 6.0、matlab 7.0为开发平台,应用Intel OpenCV Library实现了一个网球视频自动分析原型系统。实验表明,本文提出的网球视频语义分析算法具有令人满意的效果。
其他文献
网络化多智能体编队控制广泛存在于生物的群集行为、移动传感器网络的最优化数据采集以及军事、太空等领域中的多运动体(如:移动机器人、无人驾驶飞行器、自动水下移动设备、卫
政府绩效评估工作作为提高政府效率的一种技术形式受到越来越多关注,其强大的决策辅助与管理功能也引起了政府职能部门的重视。随着计算机技术的高速发展,政府绩效评估系统也日
当前随社会经济和高新技术的发展,高超声速飞行器领域的相关研究越来越成为全世界各国科技发展的前沿和重点,各国都不断加深对高超声速飞行器相关的研究和探索,对我国而言,目
C3I系统又称为综合电子信息系统,是一个集情报获取、信息传输、分析判断、决策处理、组织协调和对抗等能力于一体的信息系统。C3I系统的评价过程是决策者和系统设计人员在论
无刷直流电机(BLDCM)具有维护方便、运行效率高的优点,已经在家用电器、工业传动以及其它领域得到了广泛应用。本文针对无刷直流电机的结构特点,采用基于DSP的无刷直流电机控制
基于磁感应耦合的感应耦合电能传输技术(Inductively Coupled Power Transfer ,简称ICPT)摆脱了传统的电能接入模式,实现了能量非接触的接入。作为一种新型的能量传递模式,感应耦合电能传输技术展示了其广阔的应用前景,为解决自动导引车(Automated Guided Vehicle,简称AGV)的供电及导引提供了一种新的途径。基于导轨式ICPT的AGV实现了沿导轨非接
在建筑设计过程中,一些空调采暖设计人员不仔细考虑每个建筑的实际能耗需求,往往是根据个人经验选择设备,加上一定的保险系数进行规划,结果往往是空调采暖的功率远超过该建筑真
在现代导航领域,GPS是当前应用最广的定位导航手段。但在一些特殊环境下,GPS信号容易受到干扰,有被阻断的风险,特别是在地下、水下、室内或高山峡谷等地区,GPS难以继续正常工
本文研究的主要内容是视频监控系统中的运动目标检测与跟踪技术。近年来,智能视频监控系统的应用已经成为各国研究的热点。运动目标的检测与跟踪正是这项研究中最基本、最核
极值搜索控制是一种不基于模型的自适应的优化控制方法,这种控制方法计算量小,只需要系统的输入输出数据,便可使被控对象收敛于极值点。然而极值搜索控制普遍存在稳态振荡问题,这