论文部分内容阅读
近年来,随着电子设备的功能日趋完善,人们录制视频的设备越来越多,上传视频也变得越发容易,因此网络上涌现出大量视频信息,并以几何级数的速度不断增长。于是,人们所能浏览到的视频种类不断增加,内容信息更加丰富,自此进入信息大爆炸的时代。视频信息爆炸的现况是把双刃剑。一方面丰富了人们的生活,使人们更容易接触并学习到各种领域的信息;另一方面,在接受大量信息的同时,由于信息的繁杂,人们很难准确、快速地找到自己所需要的信息。针对这一问题,很多研究人员提出了很多关于视频检索的解决方案,其中最有代表性是基于内容的视频检索。基于内容的视频检索主要是先将视频分割成镜头,然后从镜头中提出一个或几个关键帧,再对每一个关键帧中的有效特征进行提取,通过一系列算法将提取到的特征进行归纳整理,与相应视频绑定并存储。用户只需提供某一视频中的某些特征,与之前存储的特征进行匹配,找到对应视频信息。但此方法检索出来的只是近似的匹配结果,所以经常出现检索出相似视频但并非用户目标视频的现象,甚至可能出现和用户预期视频完全不同的检索结果。而且,由于步骤繁多、视频中可能包含过多特征,使得此方法的解析时间、检索效率很不尽如人意。本文旨在从提高视频检索的效率和准确率出发,利用视频解析引擎,对大量视频进行分析处理,提取特征并归纳总结成实体词汇,从而形成“深度字典”。“深度字典”的形成分为两大阶段:1、对成千上万的样本进行分析处理,提取关键特征,总结成词汇,构建成字典;2、利用字典表示样本。本文所述系统基于深度字典的思想,采用Node.js语言、云存储技术、MVC模型、B/S架构,通过调用Google云视频智能API对上传的视频进行在线解析,根据Google机器学习训练出来的词库,得到一系列和视频内容相关的实体词汇,将这些词汇与视频进行绑定后,一并存入数据库,用户只需提供关键字即可实现对视频的检索。系统分为用户管理,视频上传、浏览、标注和检索五大模块。相较基于内容的视频检索系统,本文所述系统在简化视频标注过程的同时,对检索的准确率也有不小的提高。