基于目标检测的视频结构化技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：adream_T

【摘要】

：

【作者】

：

李振铎

【出处】

：

电子科技大学

【发表日期】

：

2020年07期

【关键词】

：

视频结构化关键帧提取目标检测语义信息

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网络技术与物联网的迅速发展,当今的社会生活中每时每刻都在产生着海量的视频。虽然视频能够形象直观地表达信息,但其耗费的存储空间较多并且信息不具备结构性等特点,使得对它们的存储和检索相当困难。同时,现有视频压缩技术的研究进展已经远远跟不上视频数据的增长速度,这会导致视频存储代价越来越高。所以提出一种能够自动获取视频关键内容并节省存储空间的视频分析技术是当前亟待解决的问题。视频结构化技术是指将视频通过视频图像处理技术、文本分析技术等领域的算法提取出不同层次的关键信息,并对不同层次的关键信息进行相应的语义描述,最后通过视频标准化描述将关键的视频图像信息和对应的语义信息进行结构化存储,便于记录和检索视频的关键信息。本文结合了深度学习技术和传统算法,针对视频结构化技术中的部分关键技术进行研究,主要研究内容如下:(1)提出了一种结合了传统方法和深度学习的视频结构化方法。该方法主要涉及到了关键帧提取、目标检测、动作识别、场景识别、图像描述等技术,使得视频图像中的信息能够被有效的表达出来,并且能够对每一张图像生成相应的描述句,使得更便于存储和检索,极大地丰富了结构化信息的内容。(2)本文充分利用了视频中的运动目标信息,提出了一种基于运动目标信息的视频关键帧提取方法。该方法通过帧间差异、HSV空间颜色信息、运动矢量信息三者的加权融合来获取一个更为综合鲁棒的特征作为视频帧的特征指数,然后通过自适应阈值算法设定阈值对视频帧进行关键帧初选,最后通过目标检测技术对比初选关键帧的目标信息来选取出最终的关键帧。该方法充分利用了视频图像的目标信息,结合了深度学习技术,提供了一种新的关键帧提取方法。(3)优化了目标检测网络YOLOv3的结构,并提出了一种适用范围较广的目标检测效果增强方法。在网络结构方面,本文通过不同扩张率的扩张卷积对主干网络的特征图提取特征,使得特征层具有不同粒度的信息,能够更好地识别不同尺度地目标。在检测效果增强方面,本文通过提出的投影计数算法筛选出了检测力度不佳的感兴趣区域,然后使其中的目标能够尽可能匹配网络模型的最佳检测尺度,再次送入网络进行检测。综合多次检测结果,使结果更加可靠。

其他文献

头针结合反馈式作业训练治疗脑卒中后手功能障碍的临床研究

目的通过观察头针结合反馈式作业训练治疗脑卒中后手功能障碍不同治疗时间点FMA、MAS及BI评分的变化,评价头针结合反馈式作业训练对脑卒中后手功能障碍患者的临床疗效。方法本试验将符合脑卒中后手功能障碍诊断标准的患者60例,采取随机、对照的原则分为2组,即治疗组30例,对照组30例。治疗组给予头针及反馈式作业训练治疗;对照组予以头针及常规作业训练治疗。两组均治疗6次/周,每日1次,头针30min/次,

学位

脑卒中手功能障碍头针反馈式作业训练

《齐民要术》有关“得名之由”的探讨

魏晋南北朝隋唐五代时期的词源研究成果尚未得到应有的重视,其中<齐民要术>虽为农书,然亦蕴含了不少词源研究的成份,其研究表现在多个方面.

期刊

齐民要术词源研究词源学史Qiminyaoshu root of words study history of etymology

出路在于结构调整和技术进步

看病难、看病贵和上学难、上学贵是当前构建和谐社会突出的矛盾和群众关注的热点。解决看病难、看病贵已引起国家领导人和有关政府部门的高度重视。

期刊

结构调整国家领导人看病难政府部门

深圳金融业将实现四个转变

人民银行分行行长王喜义在深圳金融工作会议上指出,深圳金融业在“九五”期间要实现4个转变: 一是金融发展上要实现由量的扩张向质的提高转变。今后5年,深圳金融要实现从粗放