互联网图像搜索中的多模态融合

被引量 : 0次 | 上传用户:realmummy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对互联网图像搜索的海量、多模态的信息特征,现有图像搜图像、文本搜图像、图文结合搜图像的系统都有不尽如人意之处。为了搜到尽可能多、全面的图像,很有必要研究互联网图像搜索中的多模态融合。互联网图像搜索本质上是一种多模态学习问题。在以往对它们的研究中,涌现出许多算法和思想流派:矢量量化或共生模型、机器翻译模型、相关模型、加入类别信息的结构模型、多标注学习、互补的多模态融合、基于矩阵分解的多模态融合、基于调和场模型的多模态融合、基于对齐学习的多模态融合、多模态联合学习、一致性的多模态学习、大数据驱动的多模态学习。总结其优缺点,我们提出了要构建的多模态学习模型的设计需求。一种用文档-词条关系矩阵传播、叠加两者的相关度矩阵以学习文档语义相似度的模型被用在了多模态相似度矩阵的互相增强上。本文分析了其用在多模态学习上的不同之处,提出了加入模态内高阶相似度增强的多模态融合模型;分析了现有既考虑多数据域互相增强又考虑数据域间相关关系增强的多数据域相似度融合算法,结合多模态相似度融合的加性特点,提出了用模态间对齐去增强模态间相关关系;为了得到多模态之间匹配的相关关系,提出一种以模态间对齐为优化目标的统计模型,并把它和典型相关分析做了类比分析。大量实验用于探究它们在多模态图像搜索应用中的表现和有效性。核矩阵可以描述流形,可以把多个模态的数据投影到相似度空间相互比较。核矩阵代表的马尔可夫场的传播、对齐、流形特征都可以用引入电势概念的电路网络描述。单模态搜索可以表示为有源电路网络,等价于谱聚类。电路网络模型有其希尔伯特空间解释。网页排名、流形排序算法都可以表示为电路网络模型,由此可以反推出有源电路网络的快速迭代算法。建立了基于电路网络的多图融合模型。该模型可以用正则化优化式来表达并进一步扩展。实验验证了用电路网络做多模态融合的有效性和优势。用泊松方程理论上解释了电路网络模型,用非齐次热传导方程解释了电路网络模型的快速迭代算法、模态内高阶相似度增强的合理性;在扩散的多尺度分析基础上,分析了流形上的多尺度空间;借鉴传统信号处理中克服信号截短的缺点的对策,提出了相似度矩阵取行近邻的多分辨率滤波方案;利用偏微分方程方便加边界条件的优势,提出了基于电路网络的多模态融合模型添加模态间对齐增强的方法。总结了本文的技术路线、四方面贡献,并给出了以后的工作展望。
其他文献
<正>【设计意图】清代李渔论戏曲时曾说:"传奇无冷、热,只怕不合人情。如其离、合、悲、欢,皆为人情所必至,能使人哭,能使人笑,能使人怒发冲冠,能使人惊魂欲绝。"阅读何为的
目的:通过与阴道镜下活检病理结果对比,分析TCT检查为异常时的准确性,以评估TCT检查在子宫颈癌筛查中的有效性。方法:收集2013年12至2014年11月期间在浙江大学医学院附属妇产科
介绍了国内聚甲基丙烯酸甲酯(PMMA)的生产和市场现状,包括生产厂家、产品牌号、市场消费等。简述了聚甲基丙烯酸甲酯(PMMA)的生产技术及市场发展方向,并提出发展建议。
在言语交际中,语言使用者经常基于语境对词义进行语用处理,导致词语辞典意义或原型意义的语用充实,包括语用收缩和语用扩充。自20世纪90年代词汇语用学诞生以来,词汇语用充实
为更好地了解地区大规模风电与光伏接入对于电网稳定的影响,以江苏省南通市典型地区为研究对象,全面分析了风电场及光伏电站的出力特性,以历史实测出力数据为基础定性或定量
通过开展陆地长输管道自动焊AUT技术的可靠性评价研究工作,建立了一套完整的AUT广义可靠性理论及评价体系。通过缺陷样本容量的建立与优化计算,开展AUT工艺评定及可靠性分析
9月20~21日,国家军工保密资格认证审查组对中航工业总部进行了保密资格认证现场审查。通过召开首末次会议、涉密人员考试、查阅工作档案和现场核查等环节全面而细致的检查,中航
报纸
口译是一种即席的忠于原文的口头表达活动,通过口头表达的形式,把一种语言表达的思想内容用另一种语言来再现。其任务是在不同语言、不同文化的交谈者之间发挥桥梁和纽带作用
现代汉语语法研究中,动词和名词本身可以说是最重要的研究内容之一,而由动词和名词组合而成的线性序列“V+N”结构也一直是人们着重加以研究的一种句法结构。研究的一个方面
中性词语义偏移是当代语义学的一个关注点。本文从微观的角度,采用共时与历时相结合的研究方法,深入分析“意见”一词的语义偏移现象。通过对语料库进行穷尽性的研究,我们发现“