搜索筛选:
搜索耗时0.8067秒,为你在为你在102,285,761篇论文里面共找到 2 篇相符的论文内容
类      型:
[学位论文] 作者:岳贡, 来源:重庆大学 年份:2023
以视频为媒介的社交娱乐方式逐渐成为主流,在享受海量视频带来的轻松和便利时,如何有效处理海量视频成为亟待解决的问题。视频描述指通过机器自动生成视频内容描述语句的技术,其融合了计算机视觉和自然语言处理技术,是处理视频的重要手段之一。现有模型通过预训......
[期刊论文] 作者:李学明,岳贡,陈光伟,, 来源:电子科技大学学报 年份:2020
针对现有的图像理解描述方法存在描述句子不丰富、不准确、模型结构复杂、难以训练等问题,该文提出了一种端到端的基于多模态注意力机制(M-AT)的图像理解描述新方法。该方法首先通过关键词图像特征提取模型(K-IFE)提取更优的空间特征和关键词特征,并利用关键词......
相关搜索: