基于R-tree的高维索引结构研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:zero_alan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和多媒体技术的迅猛发展与普及,人们可以通过计算机轻易地接触并获取到大量有用的数据。如何对大量数据对象进行有效检索成为了计算机应用中的一个非常重要的研究课题,数据库技术中的索引结构正是为了解决此问题而出现。 传统的索引结构(如B—tree等)可以很好的解决单维数据的检索问题,然而现在接触到的数据大部分属于高维数据。而由于高维数据自身的无序性与复杂性等特点,传统的索引结构无法直接对其进行处理,所以必须建立高维索引来进行管理。自从Guttman提出了基于树形结构的R—tree后,相关学者纷纷在此基础上进行进一步的研究,例如在此基础上提出的R*—tree等。 本文在对R—tree族以及KDB—tree族索引结构研究的基础上,对R*—tree在处理点数据方面进行了改进。首先分析了R*—tree在处理点数据上的弱势以及改进必须解决的问题;接着在R*—tree结构的基础上提出了一种新的高维点访问方法ppR—tree(perfect point R—tree)。该方法的基本结构基于R*—tree,但是在分裂算法中结合Perfect KDB—tree中自上而下分裂的思想而提出节点重构技术,可以有效减少节点间的重叠区域;另外,在压缩节点信息方面,ppR—tree引入了有效维机制,增加了高层节点的扇出,可以有效降低树高。最后,通过实验验证了ppR—tree在全部测试维的几乎所有分布中范围查询性能优于R*—tree,KDB—tree以及Perfect KDB—tree,数据点查询性能优于R*—tree;并且,在维护代价方面,相对R*—tree并没有太大加重,但是物理利用率得到很大提高。
其他文献
随着计算机信息技术的飞速发展和企业竞争的国际化,企业要在资源有限的情况下取得长足持续性的发展,就必须充分地利用外部资源,以达到有效提高自己的核心竞争力的目的。企业
作为统计学的一个分支,聚类分析技术已经被广泛地应用了许多年。使用聚类分析,可以将隐含在未知数据中的若干个类别划分出来,从而为用户提供潜在的知识。聚类融合是近几年提出的
作为信息安全的核心技术之一,签密技术在计算量和通信成本方面都优于传统的“先签名后加密”方案。在基于属性的加密体制里,个人身份信息由一个属性集合来描述,通过使用访问结构
当今社会,网络技术突飞猛进,网络在社会经济中发挥越来越大的作用。随着网络的迅速普及,IPv4已不能满足发展的需要,IPv6取代IPv4已成为必然趋势。但是目前IPv4网络在全世界已
心电图(Electrocardiogram,简称ECG)是反映心脏兴奋的电活动过程,是人类生命活动中一个明显的体现。心电图反映了人体心脏的工作状况,它的各个波形的不同变化往往体现出了某
近些年来,随着互联网的发展和普及,P2P应用重新成为网络技术研究的热点,而使用P2P技术的文件共享系统则是其中重要的研究领域。考虑到目前基于P2P技术的文件共享系统存在着一
计算机技术和网络信息系统的快速发展,使网络安全问题逐渐凸显。而人体免疫系统中的一些能够抵御外界细菌入侵的功能引起了广大学者的兴趣,由此建立了人工免疫学学科,它是一
快速精确的碰撞检测对于提高虚拟环境的真实感和沉浸感有着非常重要的作用。碰撞检测的研究目标是如何在很高的实时交互要求下完成大量复杂物体的碰撞检测。层次包围盒是广泛
近年来,随着电子工业的快速发展,贴片元件在高精度的电子设备中使用越加广泛。贴片元件中使用数量最大的要属贴片电阻、电容、电感等无源器件。打孔纸带作为贴片阻容元件的载体
学位