数字视频镜头检测研究

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:suyihui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
镜头检测一直是数字视频处理领域的一个重要课题。镜头是组成视频的最基本的单元,镜头检测就意味着为视频的结构化表示提供基础,使更高层的语义视频处理成为可能。 本文首先介绍了镜头检测的研究现状,而后针对镜头检测中存在的问题,分别给出了基于统计模型的镜头突变检测方法以及基于EM曲线拟合的镜头渐变检测方法。本文的研究成果如下: 介绍了镜头检测的概念、研究的背景和研究的理论以及应用意义,总结了镜头突变检测和镜头渐变检测的方法,并指出了现有方法中需要关注的问题。 针对镜头检测中的需要关注的问题(相似性度量、运动检测以及光照变化)进行了详细分析。相似性度量中介绍了灰度、运动特征、直方图、边缘等相似性度量特征和方法。运动检测分别介绍了如何避免摄像机运动和视频中物体运动造成的镜头边界误检。光照变化处理中介绍了常用的闪光灯避免方法。 针对现有镜头突变检测中存在的问题,提出了一种基于统计模型的镜头突变检测方法。该方法中,采用了一种基于运动补偿的特征,来减小视频序列中运动物体对检测结果的影响;采用统计模型来建模镜头检测过程,充分考虑了先验和后验概率:最后对视频中闪光灯造成的亮度突然变化进行了检测,避免了误检。在加速算法中,采用了跳帧的方法取得了很好的加速效果。 提出了一种新的基于EM曲线拟合的镜头渐变检测方法。首先在滑动窗口中使用自适应的阈值来选择候选的镜头渐变;其次使用Kalman滤波对候选镜头渐变进行前向和后向的边界搜索;而后使用EM曲线拟合对得到的镜头渐变进行拟合,从而得到一系列的参数;最后使用决策树进行决策,判断是否为镜头渐变。
其他文献
可扩展标记语言(Extensible Markup Language)在基于Web的分布式应用系统中日益获得青睐,同时也对访问控制提出了新的挑战。在大型的企业级应用中,访问企业XML关键资源的用户
人们对问题求解规划器的研究已经持续了半个世纪之久,在众多规划器中备受瞩目的是Avrim Blum和Merrick Furst于1995年提出的经典图规划。图规划首次将规划图应用于规划器设计
随着网络的广泛应用,特别是政府信息、电子商务信息和军事数据在网络上的传输给网络安全提出了很高的要求。网络攻击方法层出不穷,入侵手段也不断更新,使得防火墙等被动式网络安
计算机的安全已经是一个十分普遍和严重的问题,传统的计算机安全技术及人工响应已不能满足复杂系统的安全性要求,入侵检测系统已成为网络计算机系统中一个有效的防范检测手段,其
媒体服务器(MediaServer)是下一代网络(NGN,NextGenerationNetwork)中的重要设备,也是分组网络中的重要设备。媒体服务器在软交换设备或应用服务器的控制下提供基本和增强业务
主机涉密信息的安全是信息网络安全的重要内容之一。本文主要研究设计并实现了基于Java的主机涉密信息监测控制系统,目的在于探讨防止主机涉密信息失、泄密的方法,以减少或杜
随着现代企业信息化进程的不断深入,对企业应用系统也提出了更高的要求,希望应用系统在提高企业内部信息共享能力的同时,能够增强对企业多变的外部需求的适应能力。面向服务
90年代以来,随着信息存储技术和通讯技术的发展,大量的信息呈爆炸式增长,信息自动分类己经成为人们获取有用信息不可或缺的工具。文本分类是中文信息处理的一个重要的研究领域。
文本摘要、分类、聚类和检索是文本处理领域中的重要技术。本文结合若干具体科研项目,在上述几个方面进行了研究和探索。在文本摘要技术方面,本文实现了一个简单的文本摘要工具
互联网知识学习较传统学习具有任务明确,学习过程中学习者知识与能力同步增长的特点,但同时面临着海量知识资源与个体学习需求难以匹配的重大挑战。推荐算法是解决该问题的有