一种基于近似向量的高维索引结构

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ccx1942
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着多媒体技术和计算机网络的飞速发展,全世界的数字图像数量正以惊人的速度增长。对于大规模图像数据库来说,线性扫描已经满足不了用户的需求。图像数据库作为高维数据库的重要组成部分,其检索离不开高维索引技术的支持,因此,其近年来备受研究人员的关注。除了多媒体检索之外,数据挖掘、决策支持等需要在大数据集里进行相似度检索的应用都需要有效的索引结构来加速查询过程。   传统的多数索引机制,如B-Tree、B+-Tree等索引结构都是对低维的数据来进行索引,当处理的数据维数超过10时,其性能急剧下降,甚至不如顺序扫描。为此,人们提出了许多索引结构,它们利用相应的技术和数据结构来组织特征向量并管理搜索过程,从而加速查询。   本文从两个角度介绍了几种重要的高维索引算法。一方面从基于数据空间划分的角度比较全面的介绍了VA-File算法及其一些改进算法,如:VAR-Tree,VA-Trie及FAC-File算法。另一方面从基于数据分布的角度介绍了常用的索引结构,如R-Tree,X-Tree,SS-Tree及SR-Tree等。在此基础上,提出了一种新的空间索引算法-一VAT。其采用VA-File中的向量近似思想,并借助索引结构来组织和管理压缩后的近似矢量。通过在UCI数据集上的仿真实验证明了VAT的性能优于VA-Trie、VA-File、R-tree,顺序扫描。
其他文献
物流被称为企业“第三方利润源泉”,目前越来越受到国内各行业的极大重视,同益成为国民经济的基础产业。事实上,中国物流与采购联合会最近发布的2007-2008物流报告中提到,我国物
随着我国证券市场的不断发展和壮大,越来越多的机构投资者和个人投资者参与股票市场的投资。因此,股票定价,即上市公司股票估值成为证券市场的核心问题,它是证券分析中最重要、最
学位
期权定价理论一直都是金融数学研究的核心问题之一,与投资组合理论、资本资产定价理论、市场有效性理论及行为金融学一起,构成现代金融学的五大理论模块。早在1973年,Black和Sch
本论文主要利用集中紧原理、山路引理、临界点理论等理论工具讨论含Hardy位势的椭圆方程解的存在性问题:一是研究一类带Hardy位势的双调和方程特征值问题的可解性;二是研究一类