基于目标检测的视频结构化技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:adream_T
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术与物联网的迅速发展,当今的社会生活中每时每刻都在产生着海量的视频。虽然视频能够形象直观地表达信息,但其耗费的存储空间较多并且信息不具备结构性等特点,使得对它们的存储和检索相当困难。同时,现有视频压缩技术的研究进展已经远远跟不上视频数据的增长速度,这会导致视频存储代价越来越高。所以提出一种能够自动获取视频关键内容并节省存储空间的视频分析技术是当前亟待解决的问题。视频结构化技术是指将视频通过视频图像处理技术、文本分析技术等领域的算法提取出不同层次的关键信息,并对不同层次的关键信息进行相应的语义描述,最后通过视频标准化描述将关键的视频图像信息和对应的语义信息进行结构化存储,便于记录和检索视频的关键信息。本文结合了深度学习技术和传统算法,针对视频结构化技术中的部分关键技术进行研究,主要研究内容如下:(1)提出了一种结合了传统方法和深度学习的视频结构化方法。该方法主要涉及到了关键帧提取、目标检测、动作识别、场景识别、图像描述等技术,使得视频图像中的信息能够被有效的表达出来,并且能够对每一张图像生成相应的描述句,使得更便于存储和检索,极大地丰富了结构化信息的内容。(2)本文充分利用了视频中的运动目标信息,提出了一种基于运动目标信息的视频关键帧提取方法。该方法通过帧间差异、HSV空间颜色信息、运动矢量信息三者的加权融合来获取一个更为综合鲁棒的特征作为视频帧的特征指数,然后通过自适应阈值算法设定阈值对视频帧进行关键帧初选,最后通过目标检测技术对比初选关键帧的目标信息来选取出最终的关键帧。该方法充分利用了视频图像的目标信息,结合了深度学习技术,提供了一种新的关键帧提取方法。(3)优化了目标检测网络YOLOv3的结构,并提出了一种适用范围较广的目标检测效果增强方法。在网络结构方面,本文通过不同扩张率的扩张卷积对主干网络的特征图提取特征,使得特征层具有不同粒度的信息,能够更好地识别不同尺度地目标。在检测效果增强方面,本文通过提出的投影计数算法筛选出了检测力度不佳的感兴趣区域,然后使其中的目标能够尽可能匹配网络模型的最佳检测尺度,再次送入网络进行检测。综合多次检测结果,使结果更加可靠。
其他文献
目的通过观察头针结合反馈式作业训练治疗脑卒中后手功能障碍不同治疗时间点FMA、MAS及BI评分的变化,评价头针结合反馈式作业训练对脑卒中后手功能障碍患者的临床疗效。方法本试验将符合脑卒中后手功能障碍诊断标准的患者60例,采取随机、对照的原则分为2组,即治疗组30例,对照组30例。治疗组给予头针及反馈式作业训练治疗;对照组予以头针及常规作业训练治疗。两组均治疗6次/周,每日1次,头针30min/次,
魏晋南北朝隋唐五代时期的词源研究成果尚未得到应有的重视,其中<齐民要术>虽为农书,然亦蕴含了不少词源研究的成份,其研究表现在多个方面.
看病难、看病贵和上学难、上学贵是当前构建和谐社会突出的矛盾和群众关注的热点。解决看病难、看病贵已引起国家领导人和有关政府部门的高度重视。
人民银行分行行长王喜义在深圳金融工作会议上指出,深圳金融业在“九五”期间要实现4个转变: 一是金融发展上要实现由量的扩张向质的提高转变。今后5年,深圳金融要实现从粗放
广东省在圆满实现去年价格控制目标11.6%的形势下,提出该省价格控制目标,比全国10%的目标略低。为此,将采取以下调控措施: 一、进一步完善各级政府价格控制目标责任制,把抑制通
【正】 鲁迅是中国文化革命的主将。他对中国革命文艺事业作出了卓越的贡献,给我们留下了一笔极其珍贵的精神遗产。其中,不但有大量的战斗杂文,有小说、散文、文艺理论和翻译
【正】 经师易遇人师难, 做到人师要红专。 如何红? 人人最好学雷锋。 如何专? 实事求是加三敢。
“九五”期间,济南市的固定资产投资将近900亿人民币,其中利用外资200亿元人民币。这包括扩建机场、兴建电厂及投资达50亿的工业项目。 济南市计委副主任刘善鹏最近表示,今年
【正】要使形式逻辑更好地对说话、写文章起指导作用,就必须研究它在自然语言中的表现。概念、判断在自然语言中的表现,逻辑与语言界已有不少论著。我们拟对推理在自然语言中