视频描述相关硕士博士期刊学术论文

视频描述相关论文

基于层次网络和辅助任务的视频描述生成方法研究

现如今社会,海量的信息每时每刻都在产生,这其中包括了各种各样的图片、视频和文本信息,我们统称为多媒体信息,同时处理这些信息的......

学位

视频描述注意力机制层次结构表征学习辅助性任务

基于深度学习的图像和视频描述

在如今的大数据时代,手机和电脑等智能产品已经成为人们日常生活中不可或缺的物品,人们利用它们进行学习、娱乐和了解世界。在这样......

学位

深度学习图像描述视频描述注意力机制重建机制

基于深度学习的短视频文字描述研究

近年来,视频类数据尤其是短视频呈爆炸性增长趋势。在视频智能分析中,让机器理解视频内容是最关键的一步,而用自然语言描述视频的......

学位

视频描述强化学习注意力机制全卷积网络密集描述

基于深度学习的多特征多模态视频描述方法研究

随着深度学习技术的不断发展和神经网络强大的学习能力,视频描述作为一项连接计算机视觉和自然语言处理的新型跨模态任务,引起了国......

学位

深度学习视频描述多特征融合密集视频描述多模态融合

基于扩张卷积的注意力机制视频描述模型

针对视频描述过程中视觉特征和词特征关联度不足、训练效率低、生成的自然语言出现错误和指标分数不高的问题,提出了一种基于扩张......

期刊

视频描述 Inception-v4 长短期记忆网络扩张卷积注意力机制

基于语义信息的视频摘要技术研究

视频作为当今时代承载信息的重要载体,其与人们的生产生活息息相关密不可分,规模也与日俱增。近些年来,随着移动网络与自媒体快速......

学位

视频摘要对抗生成网络视频描述语义一致性

从视频到语言:视频标题生成与描述研究综述

视频标题生成与描述是使用自然语言对视频进行总结与重新表达.由于视频与语言之间存在异构特性,其数据处理过程较为复杂.本文主要......

期刊

视频描述卷积神经网络循环神经网络语段生成情感表达逻辑语义

基于词性标注与注意力机制的视频密集事件描述算法研究

近几年来,随着高清视频监控的逐步推广普及、短视频社交软件及直播软件的火爆发展,使得视频数据爆炸式上升。而怎样分析这些海量视......

学位

视频密集事件描述时序动作生成视频描述单词标注注意力机制

消息传递与分层解码在视频描述中的应用

本文针对已有视频描述方法中提取的特征难以捕获视频中对象之间的相互联系,以及解码过程中难以充分利用特征重构视频信息的现状,提......

期刊

深度学习视频描述时空注意力消息传递网络分层解码器

基于视频描述和阅读理解的视频问答研究

针对大多数视频问答(VideoQA)模型将视频和问题嵌入到同一空间进行答案推理所面临的多模态交互困难、视频语义特征保留能力差等问......

期刊

视频问答视频描述阅读理解

视频萃取

视频数据是人们日常生活中最重要的信息载体之一.视频萃取(video distillation)通过研究视频数据的时空和语义特性,探索简洁高效的......

期刊

视频萃取视觉表征视频摘要视频浓缩视频描述计算机视觉人工智能

视频检索技术的关键问题研究

在海量的视频数据面前,人们要想像检索文字信息一样去检索自己感兴趣的视频内容,其中最关键的问题就在于视频能否具备与其内容相匹......

期刊

视频检索视频描述深度学习自然语言

基于变化检测的视频对象分割方法研究

多媒体数据处理技术的发展趋势将是基于内容的处理,这实际上是信息处理的更高阶段,更加向人自身的信息处理方式靠近。MPEG-4及后来......

学位

视频分割变化检测时空联合背景估计

基于动态视觉注意的多语言视频描述算法

针对视频描述任务,提出一种基于动态视觉注意的多语言视频描述算法。基于基础编解码结构,提取视频片段的时空特征信息和语义属性信......

期刊

视频描述语义属性长短期记忆网络动态注意力多语言

融合深度学习和视觉文本的视频描述方法

为解决当前视频描述任务中,生成描述视频的文本整体质量不高的问题,提出一种融合深度网络和视觉文本的视频描述模型。首先在编码阶......

期刊

视频描述 3D残差模块注意力机制深度学习

基于对抗增强学习的视频描述方法研究

在互联网发达的现今社会,每时每刻都会有大量视频数据上传到移动设备和社交媒体上,视频数据的爆炸性增长已经成为这个时代的重要特......

学位

视频描述对抗训练增强学习生成对抗网络

基于深度学习序列模型的视频描述算法的研究

视频描述是计算机视觉领域的一个研究热点,具有广泛的应用场景,包括视频检索,视频理解等领域。视频描述的定义是对一个视频片段用......

学位

视频描述编码器-解码器多模态注意力多层编码器

基于审议机制的视频描述方法研究

视频描述任务旨在利用计算机自动生成人类可读的自然语言来描述视频内容。近年来视频描述在人机交互、视频的快速检索、视觉障碍辅......

学位

视频描述审议机制注意力机制强化学习深度学习编码器-解码器

基于视觉语义增强的视频描述生成

随着人工智能的不断发展,视频描述生成作为自然语言处理和计算机视觉两个领域相结合的研究课题,在近几年来受到了广泛的关注。视频......

学位

深度学习视觉语义一致性视频描述语义挖掘

基于深度学习的视觉信息自然语言描述方法研究

随着计算机网络的普及和多媒体信息技术的快速发展,社交媒体早已成为人们生活不可或缺的一部分。网络中流传的海量多媒体数据,意味......

学位

视频描述注意力机制多模态信息

注意语义的视频摘要

随着存储硬件的不断升级以及数据传输速度的不断提升,记录视频变得越来越廉价和快捷。怎么有效地存储以及浏览这些视频是视频摘要......

学位

循环神经网络注意力机制编码器-解码器视频描述图聚类

基于深度学习的细粒度体育视频描述研究

视频描述技术指的是通过构建神经网络来挖掘视频中的图像信息及含义,并将其以便于人为理解的文字形式输出描述语句或段落的技术。......

学位

视频描述细粒度深度学习循环神经网络体育视频解说

面向监控视频的语义建模研究与实现

如今,监控视频广泛应用在在机场、地铁、车站、校园等公共场所中,深入到了人们生活的方方面面。随着视频监控相关市场规模的扩大,......

学位

前景提取视频描述语义属性注意力机制

导入让我煞费苦心

我在讲授《定滑轮》一课时,刚一上课,我播放了一个动画视频,视频描述的情景是:胖人用定滑轮从楼下往三楼运一袋重物,当他利用定滑......

期刊

定滑轮视频描述胖人动画爬楼梯大屏幕眼睛学生绳子魔法讲授地面

基于多特征的视频描述生成算法研究

针对视频描述生成任务,提出一种基于多特征的描述生成算法。分析和提取视频片段的视觉信息和语音信息,经融合后形成丰富的视频语义......

期刊

视频描述多特征长短期记忆网络注意力机制

基于运动活力的视频分镜中关键帧的提取

通常在我们描述一种关键帧提取方法时,总会有这样一种印象,即视频描述的运动强度越高,就越需要更多的关键帧才能表述其内容。实验......

期刊

运动强度视频描述关键帧最优方法提取算法可靠性标准颜色特征提取方法计算分割帧图像图像帧视频段强度值片段数描述子和压缩证明印象

基于C3D和视觉元素的视频描述

随着深度学习技术的发展,利用卷积神经网络(CNN)提取视频帧特征,再用循环神经网络(RNN)生成句子的方法被广泛用于视频描述任务中.......

期刊

深度学习卷积神经网络循环神经网络视频描述自适应视觉元素

基于X-Linear和语义嵌入的视频描述算法

注意力机制和视频语义嵌入使得视频描述任务取得了显著的提升,为更好地利用时序动态特征和语义信息,提出一种基于X-Linear的语义嵌......

期刊

视频描述语义嵌入 X-Linear注意力 XLSNet video caption semantic embedding X-Linear attention

基于内容视频分析的发展研究

随着多媒体技术和国际标准MPEG-4,MPEG-7的推出发展,基于内容的视频分析已经成为研究的热点.对基于内容视频分析中的视频分割、视......

期刊

内容视频分割视频描述视频检索 Content Video Segmentation Video Presentation Video Retrieval

基于多模态视频描述的中国手语识别

计算机视觉是目前我国新一代人工智能科技发展的重要方向,手语识别因其在连续性、复杂场景干扰等问题上的困难,导致其研究不仅可以......

期刊

手语识别视频描述多模态 Sign language recognition video captioning multimode

一种基于MPEG-7标准的混合交通视频描述新模型

作为最新一代的多媒体内容描述接口标准，MPEG--7正在走向成熟和实用。现提出一种基于MPEG-7标准的混合交通视频流模型，称之为基于检......

期刊

混合交通视频描述 MPEG-7 描述模型 mixed traffic video description MPEG-7 description model

基于C3D和视觉元素的视频描述

随着深度学习技术的发展，利用卷名冲经网络（CNN）是取视频帧特征，再用循环神经网络（RNN）生成句子的方法被广泛用于视频描述任务中．然而，这种......

期刊

深度学习卷积神经网络循环神经网络视频描述自适应视觉元素 deep learning convolutional neural network recm

基于多维度和多模态信息的视频描述方法

针对视频自动描述任务中的复杂信息表征问题,提出一种多维度和多模态视觉特征的提取和融合方法。首先通过迁移学习提取视频序列的......

期刊

视频描述多模态迁移学习长短期记忆网络循环神经网络 video descriptionmultimodaltransfer learninglong an

视觉场景描述及其效果评价

作为计算机视觉、多媒体、人工智能和自然语言处理等领域的交叉性研究课题,视觉场景描述的研究内容是自动生成一个或多个语句用于......

期刊

深度学习图像描述视频描述基准数据集性能评价

基于深度学习的视频描述方法研究综述

随着深度学习技术在计算机视觉领域与自然语言处理领域的突破性进展,图像描述和视频描述的跨模态研究不断涌现.由于视频的时序特征......

期刊

深度学习视频描述编码-解码 deep learningvideo captioningencode-decode

基于多头注意力机制的视频描述生成算法研究

视频描述任务的目标是给定视频片段,算法自动生成与视频内容相应的描述文本。本文的研究内容着重于对短视频片段的描述文本生成,通......

学位

视频描述多头注意力机制多模态特征半监督学习

基于深度强化学习的视频自动描述研究

视频作为互联网中最常见的媒体之一,是人们传递信息,分享生活的内容载体。相比于静态的图像,视频能够传递动态的更加丰富的内容。......

学位

视频描述深度学习强化学习定位策略注意力机制

基于深度学习的视觉内容描述技术研究

基于深度学习的计算机视觉技术是目前人工智能技术研究的热点,其中涉及到物体识别、目标检测、行为识别、视觉内容描述等广泛的领......

学位

深度学习视频描述多注意力机制显著性 GAN网络

深度学习框架下的单事件视频自动描述方法研究

因为融合了计算机视觉和自然语言处理这两个人工智能的主要领域,自动地为开放领域的视频生成自然语言描述这一任务引起了越来越多......

学位

视频描述深度学习循环神经网络卷积神经网络

注意力模型及其在视频描述生成中的应用

建立视觉内容和自然语言之间的语义联系,是多媒体分析和计算机视觉领域的重要难题之一。近年来,深度学习的发展为该问题的突破提供......

学位

视频描述深度学习注意力模型循环神经网络

基于场景分割的视频内容语义管理机制

针对视频内容管理在不同层面存在语义鸿沟的问题,提出基于UCL（Uniform Content Locater）的视频语义描述框架,该框架包含了三个层次的......

期刊

视频描述语义管理语义水印场景分割 UCL

基于深度学习视频自动描述系统设计与实现

ue＊M＃’＃dkB4＃＃8＃”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:（100084川C京市海淀区清华园申请人:清......

学位

视频描述深度学习卷积神经网络循环神经网络自然语言处理注意力机制

基于深度学习的时序动作检测和视频描述算法研究

近年来,随着大容量存储器,多媒体技术,数字化设备以及计算机网络和通信技术的快速发展和普及,网络中的视频数据呈爆炸式增长,如何......

学位

深度学习时序动作检测视频描述多尺度特征联合优化

基于深度神经网络的视频描述研究

视频描述是计算机视觉与自然语言处理领域上的一个新兴研究课题,旨在自动为目标视频生成描述语句。在早期的研究工作中,视频描述生......

学位

视频描述深度神经网络丰富语义信息时空注意力机制长度归一化

基于深度学习的视频描述技术

人工智能日益发展,深度学习应用在视频描述技术中越来越广泛,其主流的模型框架是Encoder-Decoder,即利用卷积神经网络对视频提取视......

学位

视频描述卷积区域注意力机制细粒度融合自主随机训练字幕结构损失函数

语义指导结合注意力机制与记忆网络的视频描述方法研究

用自然语言描述视频的任务被称为视频描述,其研究结合了自然语言处理与计算机视觉领域的关键技术,研究成果推动了跨模态分析技术的......

学位

视频描述多特征表示语义属性注意力机制记忆网络

基于深度学习的图像及视频描述方法研究

随着数据压缩、通信、存储等技术的迅猛发展,图像与视频数据日益增多,必须对其进行有效的管理及利用。因此,一项运用数据挖掘技术......

学位

图像描述视频描述深度学习连续Skip-gram 深度域适应

基于视频弹幕评论的自动摘要生成问题的研究

网络共享媒体的蓬勃发展产生了海量的视频数据。同时,大量复杂的视频数据也为视频标记的工作带来了巨大的挑战。自动视频标记技术......

学位

摘要生成弹幕评论视频描述

基于内容的视频语义分析关键技术

分析了视频数据与文本数据的差异,以及视频数据在视频分析检索方面存在的问题。从视频内容分析领域的研究热点出发,分别对视频语义......

期刊

视频内容分析视频对象视频描述

基于多模态信息的视频描述算法

为了挖掘视频中不同的模态信息,提出一种基于多模态信息的视频描述算法。在基本的编码解码器网络基础上,更加关注视频多模态信息和......

期刊

视频描述多模态信息语义属性强化学习

看过本文同时还关注