面向跨媒体检索的层级循环注意力网络模型

来源 :中国图象图形学报 | 被引量 : 0次 | 上传用户:chenming88623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的跨媒体检索旨在以任意媒体数据检索其他媒体的相关数据,实现图像、文本等不同媒体的语义互通和交叉检索。然而,"异构鸿沟"导致不同媒体数据的特征表示不一致,难以实现语义关联,使得跨媒体检索面临巨大挑战。而描述同一语义的不同媒体数据存在语义一致性,且数据内部蕴含着丰富的细粒度信息,为跨媒体关联学习提供了重要依据。现有方法仅仅考虑了不同媒体数据之间的成对关联,而忽略了数据内细粒度局部之间的上下文信息,无法充分挖掘跨媒体关联。针对上述问题,提出基于层级循环注意力网络的跨媒体检索方法。方法首先提出媒体内—媒体间两级循环神经网络,其中底层网络分别建模不同媒体内部的细粒度上下文信息,顶层网络通过共享参数的方式挖掘不同媒体之间的上下文关联关系。然后提出基于注意力的跨媒体联合损失函数,通过学习媒体间联合注意力来挖掘更加精确的细粒度跨媒体关联,同时利用语义类别信息增强关联学习过程中的语义辨识能力,从而提升跨媒体检索的准确率。结果在2个广泛使用的跨媒体数据集上,与10种现有方法进行实验对比,并采用平均准确率均值MAP作为评价指标。实验结果表明,本文方法在2个数据集上的MAP分别达到了0. 469和0. 575,超过了所有对比方法。结论本文提出的层级循环注意力网络模型通过挖掘图像和文本的细粒度信息,能够充分学习图像和文本之间精确跨媒体关联关系,有效地提高了跨媒体检索的准确率。
其他文献
采用纤维素酶酶解预处理与醇浸提相结合提取工艺从甜橙皮中提取黄酮,与传统工艺相比,甜橙皮中黄酮浸出率显著提高。在单因素实验基础上,通过正交实验得出酶解温度、酶解时间、酶
用乙酸酐对多孔淀粉进行乙酰化表面疏抽洼改良,制得吸油率更高乙酰化多孔淀粉;研究表明,反应体系温度为30℃,pH值为7.0~7.5,乙酸酐加入量为淀粉质量10%,反应时间120min,在此条件下制得乙
详细研究了两种新型铁电液晶的非线性光学性质,液晶分子倾斜角θt、色散折射率,双折射率,双轴折射率和非线性光学系数各分量dij,两次谐波信号强度受外加电场及温度的影响,并分析了液晶
中专学校学生层次复杂,且学生年龄都在15~18岁之间,处于青年早期。其精力充沛,头脑比较简单,可塑性强。加强对中专学生的思想政治教育,努力把他们培养成社会有用的人才,是教育