基于动态后继树的索引结构改进研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:yahoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代的来临,使得数据量、数据复杂度和数据的处理方式发生了很大的变化,也给如何高效地、安全地从海量数据中检索到用户所关心的信息提出了挑战。全文检索技术的出现是为了解决非结构化数据的检索需求,其核心是全文索引模型。传统的全文索引模型在进行海量数据索时,往往达不到理想的时空效率,并且其动态性、安全性欠佳。  为了提高海量数据下全文索引模型的检索效率,本文基于二元动态后继树索引模型(Streamline Dynamic Successive-Trees,SDST),提出了一个树高可变的动态后继树索引模型(Variable-Height Streamline Dynamic Successive-Trees,VHSDST),并给出其创建、检索与更新算法。实验表明,VHSDST在海量数据检索方面具有较高的优势。  为了进一步提升VHSDST的检索效率,研究了影响VHSDST检索效率的因素,提出了一个滑动窗口检索算法(Sliding Window Retrieval Algorithm,SWRA)。实验表明,该算法使得VHSDST在检索效率方面有了进一步提升。  为了提高全文索引模型的空间效率,研究了 SDST的存储结构、压缩策略和编码方式,提出了一个具有压缩特性的支持不解压查询技术的二元动态后继树压缩索引模型(Compressed Improved Streamline Dynamic Successive-Trees,CISDST),并给出其创建、检索与更新算法。实验表明,CISDST与倒排文件的压缩效率基本一致,但有较高的检索效率。  为了应对CISDST在安全性方面的需求,研究了CISDST加密需求和密文索引加密策略,提出了一个具有较强安全性的密文压缩索引模型(Encrypt and Compressed Improved Streamline Dynamic Successive-Trees,ECISDST),实验表明,ECISDST空间效率较高,具有一定的实用性。
其他文献
近年来,随着云计算技术的飞速发展,深刻的影响到了信息存储与检索服务,云存储作为一种服务,可以使得用户通过网络将数据方便快捷地存储在云服务器端。当大量的企业和个人将他
目前,智能视频监控领域飞速发展,视频监控应用到日常生活中的方方面面。智能视频监控就是使用计算机视觉和图像处理的相关处理方法,将图像中的待检测目标检测出来,对图像中待
不可否认服务已经渗透到各种网络应用中,特别是与人们生活息息相关的电子商务、电子邮件等方面。提供有效的、完善的不可否认服务成为网络安全领域的研究热点。不可否认服务由
属性约简是信息智能化处理研究的核心内容之一。近年来,Pawlak提出的粗糙集理论在属性约简方面展现出巨大的优势。然而,当数据集较大时,许多约简算法效率不高,如何快速有效地
树木作为一种常见的景观模型,在自然场景的模拟中得到了广泛的应用,如何快速绘制出具有真实感且在大规模场景中具有较高绘制效率的树木已成为计算机图形学研究的一个热点与难
消费电子产业及制造工业的高速发展对嵌入式系统的性能,规模,安全,系统利用率等方面提出了高要求。针对日益复杂的嵌入式系统,一系列应用于传统桌面及服务器领域的高新技术也
进入信息化社会后,强大的网络需求一直督促网络结构不断发生变化。为了满足这一需求,提出了立方体网络的概念,其中超立方体网络是一种最受欢迎的新型网络结构。很多学者针对
密码认证是应用最广泛的认证技术,它存在被遗忘、被破解的天然弊端。特别是随着互联网系统数量爆发式的增长,它给用户带来的记忆成本迅速增大,同时一旦密码被泄,用户将面临更
医学图像三维重建技术的目标是对人体器官和组织进行立体式可视化分析。近年来已经成为医学图像处理与分析领域的研究热点。这种技术对于临床医生观察人体内部组织和病灶提供
强化学习是一种试错学习,可解决无模型问题,在没有任何先验知识的情况下,Agent通过与环境不断交互实现基于自身经验的学习。本文研究的是连续状态动作空间的问题,传统的解决方法