基于组结构先验的跨媒体关联挖掘与检索

来源 :浙江大学 | 被引量 : 0次 | 上传用户:dsmhjs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展和智能上网设备的普及,互联网上的数据发生了极大的改变。多媒体数据的显著增长使得进行不同类型媒体数据之间相互检索的必要性日益凸显,跨媒体检索因此受到了更为广泛的关注。为了实现跨媒体数据间的相互检索,需要对不同模态的数据进行相似性的度量,深入挖掘跨媒体数据间的关联关系,从而可以更加灵活地对不同模态的多媒体数据进行比较、分析和整合,实现信息的获取和加工。然而,不同模态数据间的相似性比较面临着如下两方面的挑战:一方面不同模态数据的表示方式差异很大,提取的特征处于异构空间,从而导致直接应用针对同模态或忽略模态间差异性的传统检索方法失效;另一方面,对跨媒体数据语义的抽象往往会损失信息,共同出现的不同媒体类型之间的语义也并不完全重合,有时甚至只存在隐含或松散的关联。这两方面的挑战通常被称为“异构鸿沟”和“语义鸿沟”。为了应对这两个方面的挑战,需要对跨媒体数据间关联关系进行深度挖掘和对跨媒体数据相似性度量进行系统地建模。  本文利用常和跨媒体数据一起出现的附加信息,在跨媒体中引入组结构这一先验,对传统图文对齐或图文成对出现的跨媒体数据分析方法进行补充。对跨媒体数据中组结构描述如下:在现实生活中,一般使用不同类型的跨媒体数据来描述高层概念或语义,如图像及标注单词或图像及其描述文本。这些跨媒体数据往往具有附加信息,可被用于构造跨媒体数据的组结构,如同属一个类别的图像和文本数据可构成一个组(例如描述动物的所有图像和文本),或者一篇多媒体文档中所有句子及其描述图像可组成一个组,或者社交网站中同一个社区的图像和标识文字可组成一个组。将组结构先验引入跨媒体关联挖掘与检索后,本文提出了一系列新的跨模态检索算法。这些算法都采用数据驱动的监督式学习机制,学习和挖掘联合出现的跨模态数据中所隐含的关联关系。具体而言,本文提出的方法和涉及的主要内容有:  提出一种结构性监督耦合字典学习的跨模态检索方法(SliM2)。SliM2引入了多模态耦合字典学习技术来处理不同于“单一模态”数据的“多模态”数据,对各个模态间的关联,用稀疏系数之间的线性映射来表示。通过多模态耦合字典学习,不同模态数据间的差异性被有效地表达在不同的字典中,稀疏系数间的关联关系揭示了模态间的关联关系。SliM2的创新性主要体现在两个方面:一是联合学习各个模态字典和多模态稀疏系数间的线性映射;二是通过一个混合范数((l)1/(l)2-norm)发掘属于同一类的同一模态数据的共享结构。  提出一个监督式多模态相互一致性主题增强模型(M3R),用于建模多模态数据间的隐含关联关系及不同模态间的协同和互补机制。M3R通过多模态协同挖掘模态间一致性主题,构建了一个跨模态联合概率图模型。M3R能够同时完成以下两项学习任务:一是各个模态隐含主题的学习(文本模态或图像模态);二是对表达同一语义的各模态间的一致性主题的发现和增强。M3R对表达同一高层语义的不同模态数据(构成一个跨模态超文档)所蕴含的主题进行增强,挖掘模态间一致性主题。同时,为了进一步加强所学隐含主题表达的判别能力,M3R将类别信息编码到图模型中。  提出一种基于联合映射的结构性深度跨模态检索算法(DEG),利用深度学习技术可缩小底层特征和高层语义之间的“语义鸿沟”的特性,在用深度学习特征代替传统特征的基础上,建模长文本中句子和图像之间的对应关系。DEG可处理具有嵌套层次结构的复杂文本内容和图像之间的关联关系挖掘和检索。具体来说,DEG利用深度卷积神经网络提取图像特征,利用层次反馈神经网络对文档按其结构属性进行语义映射,之后将图像深度特征映射到文本语义空间,根据训练数据中跨媒体数据间的对应关系进行排序学习,进而实现跨模态检索。  本文最后对跨媒体系统的各个方面作了分别介绍,对各种代表性跨模态检索算法作了分类和整理。设计了一个实际跨媒体检索系统并展示了其用户界面。
其他文献
设备管理位于网络管理中的最底层,属于网元层管理,对不同类型的网络设备开发专用的网管系统,可以突出设备的特性,同时更好地控制和管理网络设备,提高网络运行效率。本文旨在研究新
车牌识别系统是图像处理技术在智能交通系统中的具体应用.该论文主要围绕设计和实现一个实用的车牌识别系统,在涉及到的相关领域进行了展开之外,着重介绍了车牌识别系统中的
互联网及电子商务行业的发展促使了越来越多的消费者选择网上购物。为了提高网上购物的用户体验,购物网站纷纷采用评论与评分机制和推荐系统(Recommender Systems)来了解消费
本文主要研究了Web信息的提取及数据库中的知识发现方法。论文的主要内容有: 首先,本文广泛综合吸收了国内外有关数据挖掘(DM)与知识发现(KDD)方面的学术研究成果,并根据所研
进入二十世纪九十年代以来,随着信息技术的发展和信息量的高速膨胀,以及Internet的飞速发展和普及,特别是电子商务浪潮的兴起,点燃了对一种新型应用程序的需求之火。这种新型应用
社会进步赐予了人类向前发展的力量和灵感。人们对自然法则的研究与应用促进了智能算法的发展。随着科学技术的发展和人们生活水平的提高,人们正在从IT时代转向DT时代。人们生
学位
该文主要讨论群签名与门限签名两类特殊签名.群数字签名是一个比较新的概念.群数字签名具有下列三个特性.一是只有合法群成员才能代表所在群签发消息;二是签名的接收者能用唯
在当今信息飞速发展的时代,各个企业之间的竞争愈演愈烈,只有能够快速响应和预测用户需求并不断进行技术创新的企业才有可能立于不败之地。一方面为了更好的预测用户需求,了解企
计算机协同工作(CSCW)环境借助计算机及其网络技术将地域分散的一个群体相互联系,共同协调与协作来完成一项任务.随着CSCW研究的深入,为了使协作者间能以更自然、更直观、更