多模态特征相关论文
为解决传统音乐情感分类特征单一,导致训练效果差的问题,提出了一种多模态注意力融合网络模型,首先将执行情感分类使用的歌词和音频分......
人脸反欺骗技术可以准确判断捕获的人脸图像是真实人脸还是虚假人脸,是人脸识别系统安全的重要保障。传统的人脸反欺骗方法主要是利......
央视春晚是中央广播电视总台最具品牌力的综艺节目,是增加节日气氛、愉悦人民生活、传播国家形象的重要媒介。其中的语言类节目以......
根据传播学的“声画关系”理论,新闻类短视频通过音频直接有效地传达视频内容,属于典型的“主声说”视频。现有视频摘要技术忽略了声......
【目的】在线评论有用性有助于消费者快速获取有效的信息,本研究利用深度学习模型对旅游评论的有用性进行识别,以更好地让消费者和酒......
随着多媒体技术和网络通信技术的不断发展,如何高效的进行短视频智能分析与管理成为亟需解决的问题。视频描述作为智能视频分析领......
智能驾驶关键技术主要包括感知、认知和控制三个部分。环境感知作为其第一个环节,是认知和控制的基础。它使用车载传感器对本车及......
针对视频动作预测领域的算法在不同预测时间预测效果不稳定的缺陷,提出一种基于自注意力机制的多模态LSTM的动作预测模型。综合考......
在复杂的室内环境中,存在光线照射不均匀、物体繁多且大小不同,物体间颜色和纹理相似度高以及相互遮挡等情况,使基于彩色图像的分......
行为识别是视频分析领域的重要研究课题,在视频监控、医疗辅助、人机交互等场景中应用广泛,其目的是借助计算机视觉技术自动分析和......
随着深度学习日益发展,人工智能领域迎来发展热潮。无论在计算机视觉,还是自然语言处理、语音处理等领域,深度学习都取得了突破性......
近年来,人工智能研究和应用的热度持续上升,AI在许多领域中都展现出其独特的优势。智慧农业是人工智能与农业领域应用场景相结合的......
随着工业现代化时代的到来,近年来生产过程的安全性和产品质量的可靠性已经得到人们更多的重视。基于数据驱动的过程监测策略已成......
人体行为识别在计算机视觉和模式识别领域仍然是一个很有挑战性的难题。但是,具有深度感知功能的类似Kinect等产品,能为存在互相遮......
视频的镜头类型是视频底层特征和高级语义之间的桥梁,能有效弥补两者之间的鸿沟,有助于视频精彩事件检测,促进创建视频摘要,进而满足用......
多模态特征,是指通过不同特征表达方式描述对象的属性。采用多模态特征有助于提高对象固有属性的表达能力,因此在现代图像识别与检......
随着人工智能领域的高速发展,图像处理技术也愈渐成熟,其中目标跟踪在智能交通、公共场所安防、医学图像处理等方面均有广泛应用。......
在当今的信息社会时代,视频数据呈现爆炸增长的趋势。从海量视频中获取有价值的关键信息变得尤为重要。随着深度学习技术的快速发......
随着大数据与人工智能技术的发展,将人工智能技术应用到法律领域已受到越来越多的关注,利用已有的裁判文书信息进行类案推送,已经......
随着新型社交网络的兴起,社会网络服务得到了飞速的发展,这促使人们可以更加快捷方便地进行信息传播与实时交流。但是社交网络在促......
随着多媒体产业的迅速发展,在生活中音频分析、图像分析和视频处理等方面的研究得到了越来越多人的关注,如何更好地去描述一个音频......
随着计算机网络和多媒体技术的飞速发展,数字视频在人们的生活中成为不可或缺的信息载体。如何帮助人们从海量视频数据中找到自己......
网络语言随着计算机技术的兴起逐步进入人们的视野,并随之出现了网络语言学,对网络语言进行了不同方向上的研究.网络语言具有明显......
随着高校扩招和高等教育国际化趋势的增强,国内外高等学校间的竞争日益激烈,从而迫使各高校通过各种措施、手段谋求学校的发展。在此......
侦讯问答属于典型的机构性话语,具有明确的任务导向性,其任务的完成主要依靠讯问中的问和答来实现。然而侦查员与嫌疑人的问答互动......
本文以英文心理学教科书为语料,在系统功能语言学的理论框架下探讨多模态和语类之间的相互建构关系,并由此展现心理学教材的语篇特征......
人脸反欺骗是指判别捕获的人脸是真实人脸还是假人脸攻击,它可以有效保护人脸识别系统免受演示攻击,例如照片、面具、视频回放等。......
传统的图像描述模型通常基于使用卷积神经网络(Convolutional Neural Network, CNN)和循环神经网络(Recurrent Neural Network, RN......
针对视频信息具有的多模态性质,提出了融合视音频多种模态特征信息的视频融合分析框架,用以提高视频检索的正确率和效率。该框架根......
多模态地理大数据时空分析旨在融合地理大数据的多模态信息发现有价值的时空分布规律、异常表现、关联模式与变化趋势,是全空间信......
基于视频的行为识别是计算机视觉领域研究的热门课题,在视频监控、人机交互、视频信息检索、智能驾驶等众多领域都有着广泛的应用......
人体行为识别是计算机视觉领域中的一个重要研究热点,广泛应用于智能视频监控、运动行为分析、人机交互、虚拟现实等方面。近年来,......
随着"弹幕效应"的扩展,一种新兴广告形式--弹幕广告开始出现。从多模态组合形式看,这类广告最大的特点即为弹幕模态的增加,它制造......
视频描述任务的目标是给定视频片段,算法自动生成与视频内容相应的描述文本。本文的研究内容着重于对短视频片段的描述文本生成,通......
阿尔茨海默病(AD)是一种不可逆的神经退行性疾病,临床表现为记忆下降和其他认知功能损害。轻度认知障碍(MCI)是AD的前驱阶段,但尚......
在先前的人脸反欺骗方法中大多使用手工提取的特征或者仅使用单一模态上的人脸特征,并且很少注意到多通道色度的差异,因此得到的人......
针对可见光和合成孔径雷达(SAR:Synthetic Aperture Radar)图像融合问题,在图像预处理基础上,从像素级特征、纹理级特征及边缘轮廓......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
对新闻视频进行结构分析,提出一种基于多模态特征融合的新闻故事单元分割方法。将新闻视频分割成音频流和视频流,选择静音区间为音......
近年来随着数据压缩、通讯、存储技术的飞速发展,以及计算机性能的不断提高和网络的广泛普及,多媒体视频的应用得到了极大的发展。尤......
针对废弃物目标表观特征变化大,卷积神经网络对部署硬件环境要求高等问题,提出一种简易可行的基于多模态RGBD特征与多尺度融合支持......
儿童绘本是一种多模态语篇,其通过多种模态之间的协同作用来叙述故事。著名儿童绘本《我爸爸》除了充分利用多种模态共同叙事外,还......
传统的模式识别方法认为特征是相互独立的,容易忽略多模态特征之间多元的关联性,从而造成识别的误差。为此,基于超图模型,提出一种......
近些年来,基于手指的多模态特征识别逐渐成为身份鉴别领域的研究热点。然而,手指多模态特征识别的性能通常对光照变化和手指姿态变......
互联网广告效果是互联网运营领域最关注的话题,因为它直接影响互联网运营商的切身利益与用户的购物体验,广告运营商的诸多任务均已......