论文部分内容阅读
随着网络和多媒体技术的迅猛发展,视频数据种类繁多、搜索引擎也随之层出不穷,基于文本的视频检索已不能满足用户的需求,所以一种基于内容的视频检索应运而生。由于视频数据的内容丰富、数据量大、非结构化等特点,基于内容的视频检索技术还存在很大的挑战性,也让无数研究学者前赴后继投入到该领域相关技术的研究中。本文对基于内容的视频检索的四个关键技术,即特征提取、镜头边界检测、关键帧提取和视频检索展开了深入研究并且设计了一个具有便捷的人机交互界面的基于内容的视频检索系统。首先提取了颜色和纹理特征按一定的加权系数相融合的视频特征,并通过大量的实验验证了该特征的可行性。然后在镜头边界检测算法上进行了创新,提出利用K均值聚类和改进的自适应双阈值比较的自动镜头边界检测方法,利用该算法对视频进行镜头分割。再基于分割出来的镜头选取代表每个镜头的特定帧作为关键帧,并通过由关键帧序列组成的视频目录(索引)可以达到快速浏览和检索视频的目的。最后用MATLAB GUI界面设计并实现了一个基于内容的视频检索系统,该系统的视频数据库中输入了一些广告、电影片段、动漫和标准测试集里的视频的数据,并且在系统中引入了感知哈希算法和滑动窗口作为检索策略来实现视频的检索。该系统可以很好地实现视频片段的检索以及浏览功能。本课题的研究成果具有非常重要的理论研究价值和实用意义。