视频中数字时钟识别研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:ciha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的飞速发展,多媒体数据的急速膨胀给我们带来了机遇和挑战。在浩如烟海的多媒体数据中,图片和视频具有生动形象的特征,能给人耳目一新的感觉。怎样在众多的图片和视频数据中快速而准确地检索出我们感兴趣的数据,怎样自动分析图像和视频中的内容,已成为现在的研究热点。体育视频在视频领域占有很重要的地位,具有广泛的娱乐性和巨大的商用价值,对体育视频内容的自动分析更是激起了研究者们的兴趣。基于内容和语义的视频自动分析,关键是提取视频的高层特征,并建立高层特征与低层特征的映射关系。体育视频中的时间信息是一个很重要的高层特征,利用时间信息来对体育视频进行自动分析将会起到事半功倍的效果。本文研究并实现了视频中数字时钟识别系统,该系统由一系列快速而高效的算法组成。数字时钟识别属于字符识别的范畴,同样包含两个阶段:字符定位阶段和字符识别阶段。在时间字符的定位阶段,首先运用边缘检测定位出时间出现的静态候选区域;然后利用连通区域分析算法和时间数字周期性变化的规律来定位出SECOND字符的位置;接着利用混合高斯模型对图像颜色进行高斯拟合,计算出图像的前景色和背景色,并建立其它字符与SECOND字符的位置关系模型,定位出其它字符的位置。在时间字符的识别阶段,根据4个时间字符不同的变化规律,提出了不同的识别算法。对SECOND字符的识别,采用的是基于数字序列的识别算法;对TEN-SECOND字符的识别,采用的是由3个不同数字组成的数字序列的识别算法;对MINUTE和TEN-MINUTE的识别,采用的是On-the-fly SVM算法。论文对数字时钟识别系统中的每个模块进行了详细地设计和实现,画出了每个模块的流程图,并讲解了每个模块的核心算法。在时间字符的定位和识别过程中,我们对不同的算法进行了分析和比较。通过实验,我们知道时钟识别系统可以达到很好的识别效果,尤其是基于数字序列的识别算法,识别率可达100%,On-the-fly SVM算法有很好的鲁棒性和很高的识别率,比一般的SVM算法具有更好的识别效果。
其他文献
虚拟手术是虚拟现实在医学领域的应用,它在计算机中生成一个逼真的手术场景,可以用来模拟手术过程中可能遇到的各种现象。虚拟手术可用于外科医生培训、手术效果预测、手术方案
云计算思想的提出起源于对计算服务边界的经济学定义,它是一种利用互联网实现按需、便捷访问共享资源池(如计算设施、存储设备、应用服务程序等)的计算模式。云计算采用虚拟化技
极限学习器(Extreme learning machine, ELM)是训练单隐含层前馈神经网络有效学习算法。ELM克服了基于梯度的学习算法的很多不足,如局部极小、不合适的学习速率、学习速度慢等
语音分离将目标语音从背景噪声中分离出来,去除了语音中的噪声,提高了听感知质量和可懂度,可广泛应用于助听器、移动通讯、语音识别、说话人识别等领域。基于深度学习的方法
无线传感器网络集成了多种技术,是由若干具有一定存储能力、处理能力的传感器节点组成的。由于受其大小的限制,节点采用微型电池作为电源提供能量,但微型电池的能量是有限的
自然科学、工程设计、生产实际和现代化管理等领域中的很多实际问题都可以转化为目标优化问题来求解。优化技术是用于求解各类工程近似解或最优解的技术手段。一些传统的优化
1976年,公开密钥密码体制的提出是密码学的一次变革,它开辟了密码学的新时代,使得密码系统具有更高的安全性。但是,随着科技的不断进步和计算机的更新换代,攻击者破解加密信
图像分割是一种将图像分成互不重叠的区域并提取出感兴趣目标的技术,它是进行图像分析与理解的前提,图像分割的好坏直接影响到图像的分析结果,因此,图像分割在理论和实际应用中都
对无线自组网的研究主要有三种方法:软件模拟技术、实物测试床技术和半实物仿真技术。软件模拟技术通过对计算机模型来研究无线自组网的运行规律,该方法成本小、周期短,而试验
随着互联网宽带用户的普及和网络视频内容的爆炸式增长,流媒体点播服务使得人们接受信息,交流信息的方式发生前所未有的改变,流媒体点播服务已成为当前互联网最热门的应用之