视频描述相关论文
现如今社会,海量的信息每时每刻都在产生,这其中包括了各种各样的图片、视频和文本信息,我们统称为多媒体信息,同时处理这些信息的......
在如今的大数据时代,手机和电脑等智能产品已经成为人们日常生活中不可或缺的物品,人们利用它们进行学习、娱乐和了解世界。在这样......
近年来,视频类数据尤其是短视频呈爆炸性增长趋势。在视频智能分析中,让机器理解视频内容是最关键的一步,而用自然语言描述视频的......
随着深度学习技术的不断发展和神经网络强大的学习能力,视频描述作为一项连接计算机视觉和自然语言处理的新型跨模态任务,引起了国......
针对视频描述过程中视觉特征和词特征关联度不足、训练效率低、生成的自然语言出现错误和指标分数不高的问题,提出了一种基于扩张......
视频作为当今时代承载信息的重要载体,其与人们的生产生活息息相关密不可分,规模也与日俱增。近些年来,随着移动网络与自媒体快速......
视频标题生成与描述是使用自然语言对视频进行总结与重新表达.由于视频与语言之间存在异构特性,其数据处理过程较为复杂.本文主要......
近几年来,随着高清视频监控的逐步推广普及、短视频社交软件及直播软件的火爆发展,使得视频数据爆炸式上升。而怎样分析这些海量视......
本文针对已有视频描述方法中提取的特征难以捕获视频中对象之间的相互联系,以及解码过程中难以充分利用特征重构视频信息的现状,提......
针对大多数视频问答(VideoQA)模型将视频和问题嵌入到同一空间进行答案推理所面临的多模态交互困难、视频语义特征保留能力差等问......
视频数据是人们日常生活中最重要的信息载体之一.视频萃取(video distillation)通过研究视频数据的时空和语义特性,探索简洁高效的......
在海量的视频数据面前,人们要想像检索文字信息一样去检索自己感兴趣的视频内容,其中最关键的问题就在于视频能否具备与其内容相匹......
多媒体数据处理技术的发展趋势将是基于内容的处理,这实际上是信息处理的更高阶段,更加向人自身的信息处理方式靠近。MPEG-4及后来......
针对视频描述任务,提出一种基于动态视觉注意的多语言视频描述算法。基于基础编解码结构,提取视频片段的时空特征信息和语义属性信......
为解决当前视频描述任务中,生成描述视频的文本整体质量不高的问题,提出一种融合深度网络和视觉文本的视频描述模型。首先在编码阶......
在互联网发达的现今社会,每时每刻都会有大量视频数据上传到移动设备和社交媒体上,视频数据的爆炸性增长已经成为这个时代的重要特......
视频描述是计算机视觉领域的一个研究热点,具有广泛的应用场景,包括视频检索,视频理解等领域。视频描述的定义是对一个视频片段用......
视频描述任务旨在利用计算机自动生成人类可读的自然语言来描述视频内容。近年来视频描述在人机交互、视频的快速检索、视觉障碍辅......
随着人工智能的不断发展,视频描述生成作为自然语言处理和计算机视觉两个领域相结合的研究课题,在近几年来受到了广泛的关注。视频......
随着计算机网络的普及和多媒体信息技术的快速发展,社交媒体早已成为人们生活不可或缺的一部分。网络中流传的海量多媒体数据,意味......
随着存储硬件的不断升级以及数据传输速度的不断提升,记录视频变得越来越廉价和快捷。怎么有效地存储以及浏览这些视频是视频摘要......
视频描述技术指的是通过构建神经网络来挖掘视频中的图像信息及含义,并将其以便于人为理解的文字形式输出描述语句或段落的技术。......
如今,监控视频广泛应用在在机场、地铁、车站、校园等公共场所中,深入到了人们生活的方方面面。随着视频监控相关市场规模的扩大,......
我在讲授《定滑轮》一课时,刚一上课,我播放了一个动画视频,视频描述的情景是:胖人用定滑轮从楼下往三楼运一袋重物,当他利用定滑......
针对视频描述生成任务,提出一种基于多特征的描述生成算法。分析和提取视频片段的视觉信息和语音信息,经融合后形成丰富的视频语义......
通常在我们描述一种关键帧提取方法时,总会有这样一种印象,即视频描述的运动强度越高,就越需要更多的关键帧才能表述其内容。实验......
随着深度学习技术的发展,利用卷积神经网络(CNN)提取视频帧特征,再用循环神经网络(RNN)生成句子的方法被广泛用于视频描述任务中.......
注意力机制和视频语义嵌入使得视频描述任务取得了显著的提升,为更好地利用时序动态特征和语义信息,提出一种基于X-Linear的语义嵌......
随着多媒体技术和国际标准MPEG-4,MPEG-7的推出发展,基于内容的视频分析已经成为研究的热点.对基于内容视频分析中的视频分割、视......
计算机视觉是目前我国新一代人工智能科技发展的重要方向,手语识别因其在连续性、复杂场景干扰等问题上的困难,导致其研究不仅可以......
作为最新一代的多媒体内容描述接口标准,MPEG--7正在走向成熟和实用。现提出一种基于MPEG-7标准的混合交通视频流模型,称之为基于检......
随着深度学习技术的发展,利用卷名冲经网络(CNN)是取视频帧特征,再用循环神经网络(RNN)生成句子的方法被广泛用于视频描述任务中.然而,这种......
针对视频自动描述任务中的复杂信息表征问题,提出一种多维度和多模态视觉特征的提取和融合方法。首先通过迁移学习提取视频序列的......
作为计算机视觉、多媒体、人工智能和自然语言处理等领域的交叉性研究课题,视觉场景描述的研究内容是自动生成一个或多个语句用于......
随着深度学习技术在计算机视觉领域与自然语言处理领域的突破性进展,图像描述和视频描述的跨模态研究不断涌现.由于视频的时序特征......
视频描述任务的目标是给定视频片段,算法自动生成与视频内容相应的描述文本。本文的研究内容着重于对短视频片段的描述文本生成,通......
视频作为互联网中最常见的媒体之一,是人们传递信息,分享生活的内容载体。相比于静态的图像,视频能够传递动态的更加丰富的内容。......
基于深度学习的计算机视觉技术是目前人工智能技术研究的热点,其中涉及到物体识别、目标检测、行为识别、视觉内容描述等广泛的领......
因为融合了计算机视觉和自然语言处理这两个人工智能的主要领域,自动地为开放领域的视频生成自然语言描述这一任务引起了越来越多......
建立视觉内容和自然语言之间的语义联系,是多媒体分析和计算机视觉领域的重要难题之一。近年来,深度学习的发展为该问题的突破提供......
针对视频内容管理在不同层面存在语义鸿沟的问题,提出基于UCL(Uniform Content Locater)的视频语义描述框架,该框架包含了三个层次的......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
近年来,随着大容量存储器,多媒体技术,数字化设备以及计算机网络和通信技术的快速发展和普及,网络中的视频数据呈爆炸式增长,如何......
视频描述是计算机视觉与自然语言处理领域上的一个新兴研究课题,旨在自动为目标视频生成描述语句。在早期的研究工作中,视频描述生......
用自然语言描述视频的任务被称为视频描述,其研究结合了自然语言处理与计算机视觉领域的关键技术,研究成果推动了跨模态分析技术的......
随着数据压缩、通信、存储等技术的迅猛发展,图像与视频数据日益增多,必须对其进行有效的管理及利用。因此,一项运用数据挖掘技术......
学位
网络共享媒体的蓬勃发展产生了海量的视频数据。同时,大量复杂的视频数据也为视频标记的工作带来了巨大的挑战。自动视频标记技术......
分析了视频数据与文本数据的差异,以及视频数据在视频分析检索方面存在的问题。从视频内容分析领域的研究热点出发,分别对视频语义......
为了挖掘视频中不同的模态信息,提出一种基于多模态信息的视频描述算法。在基本的编码解码器网络基础上,更加关注视频多模态信息和......