标签增强的中文看图造句

来源 :计算机学报 | 被引量 : 0次 | 上传用户:xiaoxiang0122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像数据飞速增多,而计算机与人对图像数据的理解中存在语义鸿沟。如何有效地理解、组织和管理图像数据是学术界和工业界面临的一个重大挑战。利用计算机自动生成能够描述图像内容的自然语言描述有助于弥合语义鸿沟,从而有助于对图像数据的理解。现有工作致力于英文句子生成。与之不同的是,本文实现了一个面向中文的看图造句系统。通过大规模机器翻译克服了中文训练数据缺乏的问题,同时提出了结合中文标签自动预测,对深度模型预测句子进行重排序的增强方法,改善句子生成质量。在两个中文图像句子数据集Flickr8k-cn和Flickr30k-cn上的实验表明,本文提出的标签增强方法可以有效改善现有两种看图造句模型(Google模型和Attention模型)所生成句子的质量。标签增强使得Google模型在Flickr8k-cn测试集上的CIDEr指标从0.474提高到0.503,Flickr30k-cn测试集上的CIDEr指标从0.325提高到0.356。通过标签增强,Attention模型在这两个数据集上的CIDEr分别从0.510提高到0.536,从0.392提高到到0.411。
其他文献
针对快递包装回收成本较高、回收效率较低等问题,从快递包装回收物流系统主体要素和运作模式两个方面阐释了3类典型回收系统,分析了各系统的具体运作模式及流程。在此基础上,
犯罪心理的形成是一个受到各种因素相互作用、相互影响的复杂系统过程,其发展伴随着确定和随机,其演变遵循混沌定律。本文将混沌理论运用于犯罪心理生成机制研究中,结合系统
针对传统开发型模拟驾驶系统的成本高、教学型模拟驾驶系统不能够采集数据的问题。利用软件和硬件设计并实现了对模拟驾驶实验数据的采集。硬件部分的Logitech G29方向盘、汽
为获取牧群的轨迹数据,设计一种基于超越位置服务(EXLIVE)平台轨迹数据的采集系统。通过安装服务器并配置EXLIVE定位服务平台系统参数,实现平台的搭建;通过对畜群佩戴定位项
传统的配电网规划综合评价方法缺乏对配电网不同区域特点的考虑,基于供电分区并结合中高压配电网规划特点建立了一套综合评估指标体系。在指标优化方面,根据传统灰色关联方法
随着多能源互补协调、电力市场建设、数据资源获取的便捷与廉价,大能源系统给传统电能质量领域带来了挑战。针对该问题,围绕利用电能质量数据辅助电能质量以外领域进行决策支
文章基于1998—2016年我国制造业行业的面板数据,运用ACF方法和LP方法,先后测算企业层面全要素生产率,探讨较新的ACF方法在解决内生性问题上的优越性。结果表明:我国制造业全
采用离子电弧镀的方法在Ni3 Al基合金IC6上涂覆了NiCrAlY ,NiCoCrAlY及NiCoCrAlYHf 3种MCrAlX涂层 ,测试了IC6合金及其涂层 90 0℃时的抗热腐蚀性能。利用电子探针、SEM、X射
法源又为法之渊源,一般特指法的存在形式。我国《民法总则》第10条即是法源规定。将习惯纳入我国民法基本规定之中,实现了法律对社会惯行的开放,丰富了法律穷尽时的审判依据
本文基于C#开发环境,开发了一款好玩、有文化、有特色、画面精美的连连看游戏。本游戏最大的特色就是将中国传统文化的元素融入这款游戏。基于此,本文详尽给出了该款游戏中3