基于视觉概念检测的视频检索技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:AAAA1234560
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于视频概念检测的视频检索技术目的在于提取视频中的高层语义,来解决海量视频的产生和传输带来的一系列的组织、过滤、分类和检索的问题,具有巨大的科研价值和广阔的市场前景。本文介绍了视频概念检索中的主要流程和算法,围绕基于视觉相似度的聚类和基于内容的图片分类提出一系列算法和系统设计。按照视频分析的不同阶段,分为:从视频到图片-基于视觉相似度的视频摘要。在相似度度量方面,使用多分辨率LBP和归一化欧式距离,视频帧经过AHC的聚类模型后,采用基于视频结构、人脸等特征的兴趣函数的建模来选择摘要帧。视频摘要最终实现从视频片段到图片的转化。从图片到概念-基于内容的图片分类。视频摘要得到的关键帧用作后续视频分类。在深入研究底层局部和全局特征的基础上,通过颜色SIFT和VLAD模型进行探索,进行Kernel-PCA降维后实现从图片到向量的转化。通过基于SVM分类器的训练和前后融合算法实现图像分类。最终实现从图片到概念的转变。该视频摘要算法在实验中得到了不同视频中70%至96.7%的准确率,且AHC的聚类方式便于实现不同粒度下结果获得。对图片分类方面的实验使用TRECVID2012实验的数据集,并对图像分类中的各关键模块性能进行评价和分析,最终提交结果在国际近100个参赛队伍中排列前10,显示了本算法的鲁棒性和系统可行性。下一步的研究方向是在加深底层特征和机器学习算法的基础上,与移动互联网需求相结合。研发更加高效的低维特征和降低计算开销,以满足移动设备上视频和图片的处理及传输要求。
其他文献
网络流量监测是互联网技术的一个重要内容,其对网络的规划扩容、网络的管理、网络的运行维护、流量计费、网络拥塞调整和故障排除、网络应用和用户行为分析等多种应用都有着
无线传感器网络作为一种新型的基础设施,它能实时的监测、感知和采集网络覆盖区域内的信息,并将处理后的信息发送给监控者。无线传感器网络的体系结构中,网络层的路由技术已
该文首先介绍了基于ISDN的桌面会议电视系统的一般构成,之后对用于多媒体会议电视系统中特别是与数据业务相关的协议进行描进,如H.221、H.230、H.224和T.120系列协议等.论文
目前,无线网络用户的爆炸式增长导致无线接入网的能耗也迅速增加,降低无线接入网的能耗成为运营商亟待解决的问题之一。随着高速多媒体业务对无线网络服务质量要求的提升,如
本文在对移动3G网络P2P系统架构研究的基础之上,首先提出了一种基于模糊认知图的小区优先资源节点选择算法,简称CF-FCM (Cell First, FCM based)算法。该算法由P2P系统架构中
无线传感器网络技术是二十一世纪能产生巨大影响力的关键技术之一,具有巨大的市场需求和良好的发展空间,而节点定位作为其支撑技术之一,是一个有挑战和价值的研究热点。现有
本文以采集自舟山群岛的九个隔离岛屿和宁波的北草蜥(Takydromusseptentrionalis)为模型,探讨形态和繁殖生活史特征的小地理尺度变异,检测温度对卵孵化以及幼体表型特征的影响
目前,国内的电信运营商都进入了全业务运营的新阶段,逐渐从追求粗放的规模增长,转向挖掘客户需求,为用户提供细分的定制服务。但是,随着以微信为代表的移动互联网行业高速发
现在的网络的构架大部分是在30年前建立的,那时候大部分的网络使用者都是研究人员,用途也仅仅是一小部分工作伙伴或者朋友之间交流信息。随着网络的使用范围越来越广,30年前
黄河中游地区水土流失严重,不合理的黄土坡地利用方式是产生这种现象的重要原因之一。国家在该地区开展了一系列的生态建设,形成了不同的坡地景观格局。本文以小浪底库区为例,采