基于空间不等式过滤的降维索引技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:luyong1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着信息技术的高速发展,数字图书馆、数字医疗、地理信息系统等应用领域相继出现,人们的日常生产和生活中产生出大量的图像等多媒体信息。基于内容的图像检索技术正是在这样的背景下产生的。基于内容的图像检索实现的是对图像特征向量的相似性检索,这些图像的特征是在人的参与下由计算机自动提取出来的,提取出来的特征向量维数都很高,因此如何快速有效的对这些高维数据进行相似性检索成为了一个重要的研究课题。 降维技术和高维索引技术是高维相似性检索技术中的两个主要的研究方向。由于很多索引结构存在着随维数增加性能迅速下降的现象,因此有必要引入降维技术降低数据的维数。降维技术的目标是从横向约减数据的表示形式;高维索引技术的目标是有效地组织数据集,使得只访问一小部分数据集,就可以找到所需的结果,这实际是一种纵向的对数据集的约减。已有的降维方法有很多,如PCA,KLT,SVD等。针对高维索引的研究也取得了很多的成果,如R树系列、M树、VA-file、Δ树等。 基于对以上方法的分析比较,本文提出了从横向和纵向同时对数据进行约减来解决高维问题的思想。在借鉴了Δ树和M树的基础上,本文提出的解决方案是采用结合了SVD降维及层次索引的复合结构,同时依据高维数据的空间特性,提出了一种新的跨空间不等式过滤的方法。这种基于空间不等式的过滤方法的优势就是通过预计算的办法,在查询时利用空间原有的信息来进行代价很小的过滤,从而有效地减少了距离计算量。实验表明,这种过滤代价几乎可以忽略不计,能够有效地提高索引的查询性能,对于解决高维问题是非常有效的。
其他文献
当前校园网内资源闲置与资源紧张的矛盾日益加深,作者提出了校园数据网格(Campus Data Grid, CDG)的来解决这一矛盾。在 CDG环境中,数据是分布在 CDG 的各个节点上的,用户可
DNA计算是一种基于生化反应的新型信息处理模式,是一种新兴的非传统计算手段,自1994年创始以来,DNA计算的发展十分迅速,受到国内外学者的广泛关注。近年来,随着分子生物学和
随着用户通过Internet进行在线交易的普及,保护在线服务的用户私钥安全也就成为一个非常重要的课题。一般来讲,用户私钥存储在一个可以信任的服务器中,当用户需要私钥进行工
近年来,嵌入式软件作为计算机领域研究的一个重要分支得到了飞速的发展。由于嵌入式软件具有实时性、高可靠性等特点,它的开发相对于传统应用程序的开发要复杂得多,因而对相
随着以计算机技术、通讯技术、消费电子技术为主的IT产业的快速发展,实时嵌入式系统得到了越来越广泛的应用。在包括科学研究、工程设计、军事技术、商业娱乐及人们日常生活的
嵌入式防火墙是在分布式防火墙基础上发展而来的,传统的采用软件实现的分布式防火墙本意是用来保护操作系统,但是攻击者能够很轻易地通过电子邮件等方式关闭防火墙,因此,采用
分子动力学模拟作为一种计算机模拟方法,已广泛应用于物理、化学、生命科学、材料学以及医药等领域。并且,随着人类对科学探索的深入,使用高性能计算机进行大规模分子动力学
本文结合一年多来在数字电视用户管理系统的开发体会和经验,根据数字电视业务现状及未来的发展趋势,从多方利益出发,对数字电视的计费问题进行了深入探讨,力争摆脱传统观念的束缚
虚拟现实技术的不断发展,其应用领域也渗透到教育、商业、金融、海洋、农业、娱乐、房地产等领域。特别是随着Internet的发展,基于Web的虚拟现实技术的应用也不断涌现。然而这
发展智能交通系统,是解决汽车时代和城市化过程中出现的环境污染、交通拥挤、交通事故等问题的有效途径之一,是未来交通系统的发展方向。基于视频的智能交通系统以其配置灵活