【摘 要】
:
网络信息技术的兴起与发展使得大量的数据充斥在人们的日常生活中,且这些数据以多种不同的媒体形式存在。面对这些形式多样且数量巨大的数据内容,如何在这些数据中寻求它们彼此之间的关联是目前跨媒体检索研究领域亟需解决的问题和面临的巨大挑战。在跨媒体检索研究中,本文的研究重点是实现文本和图像的相互检索,设计了基于深度卷积神经网络VGGNet的跨媒体检索方法。本文的工作主要包括:(1)简要概述跨媒体数据的基本特
论文部分内容阅读
网络信息技术的兴起与发展使得大量的数据充斥在人们的日常生活中,且这些数据以多种不同的媒体形式存在。面对这些形式多样且数量巨大的数据内容,如何在这些数据中寻求它们彼此之间的关联是目前跨媒体检索研究领域亟需解决的问题和面临的巨大挑战。在跨媒体检索研究中,本文的研究重点是实现文本和图像的相互检索,设计了基于深度卷积神经网络VGGNet的跨媒体检索方法。本文的工作主要包括:(1)简要概述跨媒体数据的基本特点,对常见的跨媒体检索方法进行总结,分析己有的各种检索方法特点。(2)提出将深度卷积神经网络结构融入到跨媒体检索研究中,采用在ImageNet数据集上预训练过(pretrained)的VGGNet作为图像的特征提取器,用于提取目标数据集中图像的深度视觉特征,同时使用传统的LDA模型获取目标数据集中文本的潜在主题概率分布特征,这样就得到两个异构的底层特征空间,然后结合多类逻辑回归模型将其映射到同构的高层语义空间中,进而在该空间中利用中心相关性度量方法来计算图像与文本之间的相似度,按照相似度的大小来进行检索,最后用mAP评估实验结果。实验结果证明,深度视觉特征比传统视觉特征具有更强的图像内容表征能力,能够更加有效地提升检索效率。(3)在前一种方法的研究基础之上,为了能够更好的表征目标数据集的图像内容,提出对VGGNet进行微调(fine-tuning),同时针对深度视觉特征的特点,提出了一种改进的正则化算法。这个正则化体现在两方面,一是在目标数据集上微调卷积神经网络时,利用正则化来减弱过拟合现象;二是由于文本特征具有较强的语义判别能力,而图像视觉特征的分布特性杂乱,利用图像视觉特征与文本特征在高层语义上的对应关系,同时基于深度视觉特征的特点,在高层语义空间中使用文本语义特征对图像语义特征进行整体的正则化,有效的提高图像视觉特征的语义表征能力,实验表明该改进的方法能够更好的提升检索效率。
其他文献
目前,无人机技术日趋成熟,无人机的应用范围也日趋增大,一些隐患也随之而来。一些人非法使用无人机造成了安全事故。因此,对无人机飞行进行合理的管制是非常必要的。红外相机
负泊松比结构是一种反常的力学结构,该类结构不仅具有反常的负泊松比性质,在受到外界纵向拉伸(压缩)时会产生横向的膨胀(收缩),还在能量吸收、压痕阻力、弹性模量和切变模量
法律作为物品出现之初,总被人认为是有钱人才用的起的私有物品,老百姓总说“法律就是有钱人的游戏”“有钱就去打官司,没钱就去坐牢狱”,他们认为有钱人即使违反了法律规定,
早在上个世纪激光器的发明,为人类科研史开辟了一条新的开发的道路,随着细微微加工工艺的发展人们慢慢开始制作尺寸尺度接近光波波长形状特征的腔体,法布里-玻罗(F-P)微腔是
自问世以来,激光因其良好的方向性及单色性,在实际生产生活中有着广泛的应用。随着科技的不断发展进步,大视场宽激光光束也被广泛地应用于激光引信等方面,但若想最大限度的应
稀土过渡金属氧化物及其A、B位掺杂体系,由于具有丰富的物理性能,如超导性、铁磁性、磁致热现象、巨磁阻效应等,已成为近年来研究的热点。作为ABO3型钙钛矿氧化物的派生结构,
脉冲光纤激光器具有结构紧凑、环境稳定性好、成本低廉等优点,目前光纤激光器在通信、医疗外科手术、工业焊接、工业切割、国防空间对抗等诸多领域都有着广泛的应用。可饱和
自1995年被首次在实验上发现以来,激光诱导光丝这一独特的非线性现象便吸引了诸多学者的关注。飞秒激光成丝被认为来源于光束在介质中传输时光克尔效应的自聚焦以及多光子电
海上搜救补偿是对由海上搜救机构协调,参与海上人命救助或无法追偿的环境救助的社会救助力量的燃油消耗、船期损失等特别损失进行的适当性补偿。海洋相对于陆地的独特性决定
在过去的几十年,随着集成和通信技术应用于运输系统,车辆队列逐渐成为一种新的运输方式,人们普遍认为它可以提高运输网络的能源效率和安全性。与人类驾驶相比,队列自动驾驶可