基于动作归纳的视频摘要算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:Yeah12345678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着世界公共安全形势的日趋复杂化,越来越多的监控摄像头被安放在街道、室内场所等的各个角落,由于监控摄像头每天24小时不间断的采集数据并传回视频监控中心,导致监控视频的数量非常庞大,造成了存储空间紧张、查找困难、浏览低效等问题。  由于监控摄像头分布的位置广泛,对于某些角落的摄像头来说,很难找到与其相关的文本信息。通过对监控视频的观察发现,动作是分析目标行为的基本元素,通过分析目标行为,就可以对该视频进行线索追踪,从而进行有语义的视频摘要。因此,本文提出了基于动作归纳的视频摘要方法。  本文提出的模型主要分为两个部分:基于动作识别的视频分割和基于动作归纳的视频摘要。由于电影的文本信息获取方便,因此,本文利用电影数据作为视频分割模型的训练数据,在该模型中,本文解决了全标记数据训练的费时费力问题,通过提出连续的多实例学习模型,解决了模型训练时,弱标记带来的二义性问题。在视频摘要模型中,通过提出基于动作归纳的摘要模型,解决了视频摘要的评价问题。本文方法的主要流程为:首先,利用字幕、剧本对视频进行弱标记;然后,利用弱标记的视频训练基于连续的多实例学习的分类器;接着,利用训练好的分类器,计算监控视频的每一帧属于某个动作的概率;接下来,利用视频分割模型,将监控视频根据每一帧的概率值,分割为一个个视频片段;最后,利用基于递归神经网络的模型,对每一个动作片段进行摘要,摘要出每个动作最有区分度的视频帧。  通过本文的模型,可以从高层语义层面对监控视频进行摘要。通过多个实验结果的展示与比较,证明了本文方法相比其他方法的优势所在。
其他文献
粗糙集理论是由波兰科学家Pawlak提出的一种处理不确定知识的数学模型,该工具能够很好地对符号数据进行如属性约简、规则提取等分析,并已经在人工智能、机器学习与数据挖掘领域
基于SaaS的软件产品有灵活配置、多租户、无需部署的特性,特别适用于中小型企业。但当前的SaaS软件研究成果均以管理企业静态数据为核心功能,并未提供良好的业务流程支持。工作
随着移动通信技术的飞速发展,传统互联网流量大量的导入到移动通信网中,促使了移动通信网数据业务流量呈指数增长时,给移动互联网带来了极大的挑战。首先要面临的是无限增长的数
图形组态软件通过组件装配的方式实现监控程序的开发[10]。图形组态软件中监控图的绘制即为UI的一个构建过程,传统图形组态软件在UI构建过程中不能复用已有的图形组件,意味着
在低功率无线个域网中引入IPv6技术,可以解决其在地址配置、管理、服务、安全及与现有网络融合的通信需求。基于IEEE802.15.4实现IPv6通信的IETF6LoWPAN草案标准的发布有望实
在21世纪的今天,计算机技术、信息技术、通信技术高速发展,多媒体技术和流媒体技术在用户对交流需求越来越高的情况下应运而生。多媒体技术使人们的交流方式不仅仅局限于语言和
无线多跳网络具有灵活自组,移动性强,易于部署设置等特性,基于该网络视频传输系统的研究引起多方关注。视频传输业务具有高实时性,对网络质量有着较高的要求。所以如何做到快
随着互联网的快速发展,WEB应用在互联网上的迅速增多导致越来越多的WEB服务被企业发布到互联网上。WEB服务适用于企业内部及企业与企业之间,WEB服务在开发松散耦合的基于组件的
目前,软件开发的技术和规模都达到了一定高度,随之而来的软件质量问题也成为研究的重点。因为软件测试是提高软件质量的关键,其地位在软件开发过程中越来越重要。合理并且有
随着软件应用领域的不断扩大和深入,软件系统的异常行为会对用户造成巨大的损失,因此软件系统的可信性已经成为一个受到广泛关注的焦点问题。而开发可信的软件系统的前提是在