基于多特征融合的网络媒体综合检索

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wangy3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代,万物数字化,互联网呈几何级发展态势,特别是网络媒体(Web Media)发展迅猛。互联网的发展离不开数据的发展,这种发展不仅体现在数据规模急剧膨胀上,也体现在数据结构日益复杂上:从传统的单一文本模态向多种模态交错融合发展。面对数量巨大,结构复杂的多模态数据,传统的信息检索技术已经不能满足新形势的需求。如何合理有效的处理海量数据信息,如何从多模态数据中精确高效的匹配出相关资源成为亟待解决的问题。本文从传统信息检索技术出发,研究了单模态、多模态多媒体检索技术的发展与现状。通过整合现今成熟有效的多媒体分析索引方法、融合算法、结果合并算法,本文提出了一种基于多特征后融合的检索框架。该框架的主要思想是分别分析各模态数据特征,根据各模态索引信息并行检索,加权合并结果集。为了更好的处理规模庞大的结果集,该框架引入了ηTA合并算法,以部分合并精准率换取高效的检索速度。该框架以D-Ocean项目(编号:2010ZX01042-002-003)为依托进行了算法集成,并在实际应用中进行了测试和展示。实验证明:相比单模态检索方法,综合框架有更好的检索效果。另外,针对社会媒体海量的多模态数据,本文提出了一种基于多特征前融合建模的检索框架。该框架采用两次聚类的多特征融合方法,其主要思想是先分别对各模态数据进行特征分析,进行一次聚类,然后根据模态数据间的共生概率关系进行二次聚类。该框架兼顾了各模态自身的特性和模态间的关联性,提高了检索质量,并通过建立Lucene索引加快了检索速度。实验证明:相比基于CCA的前融合检索方法,该框架有更好的检索效果。
其他文献
随着全业务运营的到来,各运营商对市场和客户的争夺越来越激烈,而为企业贡献较高价值的中高价值客户,由于其对企业服务能力与业务特征相对最了解,也成为了各大运营商抢挖的对象。
版本控制软件是软件开发和管理过程中必备的工具,近几年托管型的版本控制软件服务越来越流行。版本控制软件一般分为三个模块:服务器,软件开发工具配套的插件,以及配置管理工
本文针对一种新型的字符二维条码图像进行识别研究。与传统图形二维条码的符号结构不同,字符二维条码由英文字母组成,故在识别过程上也有很大的区别。本文主要针对课题组研究
多投影技术在许多领域得到了广泛的应用,但多投影系统的构建以及维护过程复杂。投影仪位置的临时变动需要打断连续的展示过程对系统进行二次校正,展览过程中灯光以及环境光的
k-匿名隐私保护模型已经成为数据发布者可信的隐私保护模型。然而,受隐私保护要求的制约,即使最优的k-匿名算法,产生的数据也将十分不精确,正因为这种不精确导致了数据可用性
VoIP的日益普及使得其安全问题变得重要起来,对此国内外学者提出若干安全机制,例如S/MIME、SRTP、MIKEY、ZRTP等。这些安全机制为VoIP数据流的传输提供了一个安全通道,实现了
随着互联网在全球的快速发展,网上的信息每天都在呈指针数级的增长,用户可以在网上获得越来越丰富的信息资源。但是,随着信息类型日渐多样化,如何快速、准确找到自己感兴趣的信息
随着互联网的发展,大规模数据分析逐渐成为现代企业成功的关键。与此同时,随着云计算的出现,其高灵活性,资源按需使用以及随用随付费的模式吸引越来越多的企业将数据分析任务
月球数字高程模型的建立是人类探测月球过程中描述月表模型的第一步。本文在分析了CCD影像匹配、地面点高程计算、DEM内插等建立数字高程模型关键技术的基础上,研究确定了基于
大学计算机基础课程是非计算机专业及计算机专业的必修基础课,课程目标是让学生掌握计算机文化基础知识和具备一些计算机操作能力,如文字、图像、数据、网页的基本处理。由于