多模信息融合的足球视频事件检测与语义标注方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jansan77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络的无处不在以及各种移动终端、大容量存储设备的多样化普及为人们随时随地生产和消费视频数据提供了极大的便利。同时,快速的生活节奏使人们的空闲时间不断地碎片化,人们很难有充足的时间及时跟踪喜爱的体育节目和观看完整的视频资源。因而,如何根据用户的需求快速地从海量视频数据中找到感兴趣的视频内容成为一个亟待解决的问题。为了解决这一问题,需要根据视频所体现的内容对其进行结构化分析,为每个结构片段提供丰富的语义描述即标注,进而为视频内容的有效组织、索引和检索提供关键支持。在此背景下,本文对基于多模态信息融合的足球视频事件检测与语义标注方法所涉及的关键技术进行了系统研究。  目前的视频事件语义标注方法过于依赖视频内在特征的分析,仅为视频中的语义对象和高级语义概念赋予简单的标记,很难对视频“事件”这一高级概念形成接近人类思维的语义描述。针对该问题,提出利用视频外部资源,即互联网上语义描述丰富、适用范围广泛的赛况报道对足球视频事件进行富语义标注。根据赛况报道文本的特点,提出基于潜在语义分析的文本分类方法实现赛况报道中事件类型的检测。  为了有效分析视频内容,提出和改进多个中级语义对象的检测方法,进一步提升中级语义对象的检测性能。提出基于马尔可夫随机场的比赛场地检测方法,与现有基于颜色直方图和高斯混合模型的方法相比,所提出的方法对不同的比赛场地适应性强,球场像素检测准确率高。通过对球门特征的分析和重新设计,改进了现有的球门检测方法,经过严格的测试表明改进后的球门检测方法具有更好的检测效果。提出了一种快速准确的足球视频中圈检测方法,同时具有快速最小二乘中圈检测方法的检测速度快的特点和基于霍夫椭圆检测方法的准确率高的特点。提出了一种新的基于霍夫直线检测的哨声检测方法,提高了现有哨声检测方法的检测准确率,并结合隐马尔可夫模型实现音频。
其他文献
本课题基于实际项目《疾病防控与儿童免疫管理系统》的开发,从实际应用出发,对现存决策树分类方法进行了研究,提出决策树分类算法的不足并对ID3算法提出了改进,并应用到系统当中,
企业知识门户通过整合企业的各种信息资源,为企业和员工提供所需要的知识。它将企业门户技术与知识管理理论及方法相结合,利用门户(Portlet)组建技术,支持单点登录,为企业员工提
为了更具有竞争力,企业必须能够更灵活,快速地对多变的市场环境做出反应,这就需要利用各种知识,以前的,现在的,本领域的,其他领域的等等,而做到这些的关键就是企业知识的共享和重用。
图像分割是一种重要的图像处理技术,它得到了人们的重视和研究,并在实际中得到了大量应用。图像的边缘表达了图像的大部分信息,在实际应用特别是遥感图像处理中,图像的边缘检测是
由于磁盘的读写速度受到盘内磁头读写速度的限制,其实际的传输速度并不能达到ATA接口速度的最大值,因此降低了整个计算机系统的性能。针对以上问题,将Flash和磁盘相结合,在Fl
今天Internet在全世界范围内迅速发展壮大,伴随着网络的发展,网络安全问题也日益突出。网络蠕虫和病毒肆虐,给网络用户造成了巨大的损失。特别值得注意的是蠕虫在发展过程中
计算机网格为分布的资源共享和协同工作提供了优异的基础设施和平台。网格中间件将分布的计算机资源粘合在一起,构成了一个巨大的虚拟机和资源库,在科学计算中获得了成功的应
流媒体技术是近年来研究的一个热点。随着Internet的普及与发展,流媒体技术在网络中有着越来越广泛的应用,如视频会议、视频点播、电话和远程教育等,己经从实验室逐步应用到
WinCE是一种实时嵌入式操作系统,其应用范围广泛,是当前嵌入式开发领域的热点之一。WinCE在内存管理方面与其它操作系统不同,应用程序可用的虚拟地址空间为32MB。而实际项目要求
随着互联网的迅速发展,越来越多的人们希望通过网络来获取他们需要的信息。在这样的需求背景下,搜索引擎技术应运而生,它以庞大的数据容量,快速的用户响应与人性化的网站排名