基于深度学习的图像视频的分割与识别

来源 :青岛大学 | 被引量 : 0次 | 上传用户:a419132258
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,多媒体视频作为一个重要的数据载体,在信息传播中发挥着巨大的作用。然而信息膨胀,给多媒体视频的精准检索带来了巨大挑战。最早的多媒体视频检索技术是采用人工标注的方法完成的。随着视频数量急剧增加,人工标注已经成为不可能完成的任务。后来又建立了基于低层特征的检索系统,但效果并不好。近年来,视频分割成为了视频检索研究的热点,视频分割可以从视频序列中分离出有意义的实体,提高检索的准确度和效率。随着深度学习的不断发展,深度学习技术在计算机视觉任务中取得了长足的进步。目前图像分割与识别的方法都是基于深度学习的,通过深度学习学习到高层次语义特征,可以精准的对图像分割与识别。随着深度学习在图像分割与识别上取得了巨大成功,大家开始使用深度学习的方式进行视频的分割与识别。本文提出了基于深度学习的图像视频的分割与识别方法。图像分割与识别采用的是实例分割方法,并在Mask R-CNN网络基础上给出一种实例分割网络,通过重新设计Mask R-CNN掩码分支结构,来改善和加速实例分割。在掩码分支上通过增大ROIAlign层的分辨率以及使用了前后层特征融合的方法,得到了更加精确的边界信息。在不影响算法精度的前提下采用深度可分离卷积减少了训练参数,提高了算法的效率。视频的分割与识别是建立在图像分割与识别的基础上的,步骤包括镜头分割、关键帧提取和分割与识别。本文镜头分割采用了基于χ~2直方图的方法,只需要考虑像素分布情况,可以很好的检测到变化比较大的镜头。关键帧的提取使用了基于内容分析的方法,该方法可以随着镜头内容变化自适应选取出关键帧。对于提取到的关键帧使用实例分割网络模型进行分割与识别,经过实验证明,本文的算法可以有效地对图像视频分割与识别。
其他文献
常用M P 3播放器听歌的朋友往往会遇到这样的烦 恼:辛辛苦苦下载来的音频文件却由于格式问题不能播 放,或者由于播放器容量不够,不能把自己收集的歌曲 完整收录。其实我们可
认识阿拉QQ大盗 最近出现一个厉害的专盗QQ号工具——阿拉QQ大 盗,该工具实际上是一个木 马,它可以在在QQ登录时记 录击键顺序,然后以电子邮件 的方式将号码和密码一起传送
伴随着《杜拉拉升职记》电影的上映及电视剧的热播,历经了从畅销书到电视剧,再到电影的"杜拉拉"成为了人们热议的话题。其中关于职场与人生的智慧更是被视为"职场的圣经",堪比"比
<正> 血栓性静脉炎是一种常见病,临床以肢体肿胀、疼痛为特点,且下肢为多。我们应用中西医结合方法治疗本病89例效果良好,报告如下。临床资料1、一般资料:男53例,女36例;年龄
颤振是限制机床加工效率的主要因素,降低工件表面加工质量,产生噪声,加速刀具磨损,降低刀具使用寿命。对车床进行颤振稳定性预测,可以在保证加工质量的前提下显著提高切削效
<正> 溃疡是外科临床上的常见病。1985年以来,我们通过发掘整理,在古方亚圣膏(《医宗金鉴&#183;外科心法》)的基础上,经过反复筛选研制而成的溃疡宁膏,治疗不同类型溃疡患者1
伴随着人们生活水平的不断提高,我国的保险行业取得了飞速的发展,各保险公司的业绩正蒸蒸日上。然而,伴随80后逐步成为职场中坚力量,其独特的个性特征对工作的影响日益显现,
“四位一体”指沼气池、太阳能畜禽舍、厕所及太阳能日光温室建成一体,以沼气为纽带,养殖与种植有机结合的生态农业模式。文中对临漳县以早露蟠桃为种植对象的“四位一体”生态
无刷双馈电机是一种新型交流电机,在变速驱动和变速恒频恒压发电方面均具有良好的应用前景。无刷双馈电机的定子由两套不同极数的绕组构成,转子采用一套特殊结构转子绕组构成
近些年国内外经济形势复杂多变,企业竞争日益激烈,许多企业为了提升自身利润,降低企业成本,将阿米巴经营管理模式作为寻求改变的选择。本文将重点探究在阿米巴经营模式下构建内部定价体系对企业产生的效果,以及在阿米巴经营模式下采用构建服务质量模型优化内部服务定价的内容。本文将案例与理论联系起来,基于责任会计、事项会计和作业会计的理论基础,通过对案例详细的分析发现H公司结合自身情况将公司内部岗位界定为五类阿米