论文部分内容阅读
随着计算机技术的飞速发展,多媒体数据的急速膨胀给我们带来了机遇和挑战。在浩如烟海的多媒体数据中,图片和视频具有生动形象的特征,能给人耳目一新的感觉。怎样在众多的图片和视频数据中快速而准确地检索出我们感兴趣的数据,怎样自动分析图像和视频中的内容,已成为现在的研究热点。体育视频在视频领域占有很重要的地位,具有广泛的娱乐性和巨大的商用价值,对体育视频内容的自动分析更是激起了研究者们的兴趣。基于内容和语义的视频自动分析,关键是提取视频的高层特征,并建立高层特征与低层特征的映射关系。体育视频中的时间信息是一个很重要的高层特征,利用时间信息来对体育视频进行自动分析将会起到事半功倍的效果。本文研究并实现了视频中数字时钟识别系统,该系统由一系列快速而高效的算法组成。数字时钟识别属于字符识别的范畴,同样包含两个阶段:字符定位阶段和字符识别阶段。在时间字符的定位阶段,首先运用边缘检测定位出时间出现的静态候选区域;然后利用连通区域分析算法和时间数字周期性变化的规律来定位出SECOND字符的位置;接着利用混合高斯模型对图像颜色进行高斯拟合,计算出图像的前景色和背景色,并建立其它字符与SECOND字符的位置关系模型,定位出其它字符的位置。在时间字符的识别阶段,根据4个时间字符不同的变化规律,提出了不同的识别算法。对SECOND字符的识别,采用的是基于数字序列的识别算法;对TEN-SECOND字符的识别,采用的是由3个不同数字组成的数字序列的识别算法;对MINUTE和TEN-MINUTE的识别,采用的是On-the-fly SVM算法。论文对数字时钟识别系统中的每个模块进行了详细地设计和实现,画出了每个模块的流程图,并讲解了每个模块的核心算法。在时间字符的定位和识别过程中,我们对不同的算法进行了分析和比较。通过实验,我们知道时钟识别系统可以达到很好的识别效果,尤其是基于数字序列的识别算法,识别率可达100%,On-the-fly SVM算法有很好的鲁棒性和很高的识别率,比一般的SVM算法具有更好的识别效果。