论文部分内容阅读
网络的无处不在以及各种移动终端、大容量存储设备的多样化普及为人们随时随地生产和消费视频数据提供了极大的便利。同时,快速的生活节奏使人们的空闲时间不断地碎片化,人们很难有充足的时间及时跟踪喜爱的体育节目和观看完整的视频资源。因而,如何根据用户的需求快速地从海量视频数据中找到感兴趣的视频内容成为一个亟待解决的问题。为了解决这一问题,需要根据视频所体现的内容对其进行结构化分析,为每个结构片段提供丰富的语义描述即标注,进而为视频内容的有效组织、索引和检索提供关键支持。在此背景下,本文对基于多模态信息融合的足球视频事件检测与语义标注方法所涉及的关键技术进行了系统研究。 目前的视频事件语义标注方法过于依赖视频内在特征的分析,仅为视频中的语义对象和高级语义概念赋予简单的标记,很难对视频“事件”这一高级概念形成接近人类思维的语义描述。针对该问题,提出利用视频外部资源,即互联网上语义描述丰富、适用范围广泛的赛况报道对足球视频事件进行富语义标注。根据赛况报道文本的特点,提出基于潜在语义分析的文本分类方法实现赛况报道中事件类型的检测。 为了有效分析视频内容,提出和改进多个中级语义对象的检测方法,进一步提升中级语义对象的检测性能。提出基于马尔可夫随机场的比赛场地检测方法,与现有基于颜色直方图和高斯混合模型的方法相比,所提出的方法对不同的比赛场地适应性强,球场像素检测准确率高。通过对球门特征的分析和重新设计,改进了现有的球门检测方法,经过严格的测试表明改进后的球门检测方法具有更好的检测效果。提出了一种快速准确的足球视频中圈检测方法,同时具有快速最小二乘中圈检测方法的检测速度快的特点和基于霍夫椭圆检测方法的准确率高的特点。提出了一种新的基于霍夫直线检测的哨声检测方法,提高了现有哨声检测方法的检测准确率,并结合隐马尔可夫模型实现音频。