基于不确定数据的范围查询算法的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:haha300n
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的不断发展,现实生活开始频繁出现类似于无线射频识别(RFID), GPS导向,无线传感器,雷达测速等实际应用。由于信息采集技术,信息存储等客观因素的限制以及仪器设备精密度的限制,导致了不确定数据的产生。不确定数据固有的不确定性使得在管理不确定数据时引入了概率的需求,概率可以较准确的描述不确定数据的属性相关值。所以,尽管传统的数据库管理技术已达到比较成熟的阶段,但由于没有考虑概率需求,传统的数据管理技术已不再适用于不确定数据,这对数据库理论与技术提出了新的挑战。目前,虽然不确定数据通常都采用概率数据模型表示,较强的表示了不确定数据间的相关性,但在查询与概率推理方面其时间复杂度相对过高。所以,研究一个能支持不确定数据的高效索引和快速查询算法是当前的重点也是热点问题。本文针对不确定数据查询问题,进行了一定的分析与研究。首先,提出了一种新的索引结构S-Box来管理不确定数据。这种结构可以有效地支持基于概率数据的范围查询。S-Box是一种由R-tree改进而来的树型结构。在索引结构中,我们主要记录本论文提出的一种新的框架——skeleton 。在S-Box的每个节点中,我们都记录了一组skeleton,它可以在空间上为查询提供一个非常紧凑的边界约束bound,以至于可以过滤掉与查询区域没有重叠的部分对象,减少查询的访问代价和时间开销,提高查询速度。其次,我们提出一种新的数据结构BBD+-tree管理不确定数据对象。BBD+-tree采用多分辨率网格很好的刻化了对象的概率密度函数,在概率上为查询提供了紧凑的bound。再者,基于S-Box的索引结构,我们提出了两种查询算法对不确定数据进行范围查询。算法SBO利用S-Box返回出现在一个查询区域内的概率大于某一概率阈值的不确定数据对象。算法中用到了骨架skeleton和剪枝策略,使得查询可以大范围的减小搜索空间和计算开销,从而提高查询速度和效率。进一步,我们提出了SBO算法的优化算法SCFB,算法的基本思想与SBO基本一样,不同的是我们设计了一个过滤器CF,这个过滤器CF用在访问对象对应的BBD+-tree之前。如果对象可以通过CF直接被剪枝掉,则就不需要访问BBD+-tree,减少了访问BBD+-trree的时间开销,否则,需要继续访问BBD+-tree。SCFB算法进一步在时间开销上进行了优化,使得查询更加快速有效。最后,为了分析验证S-Box结构以及相关算法的性能优势,我们做了大量的比对试验。通过与典型的U-Tree,UD-Tree进行实验比对分析,实验结果表明,本文提出的索引结构和算法具有良好的性能优势。
其他文献
随着超级计算机的发展,尤其是集群计算机的发展,如何提高集群计算机互联网络的传输效率,从而提高集群计算机的效率,成为亟待解决的问题。Infiniband技术的出现很大程度上解决了这
随着信息时代的到来,硬盘数据的保密需求与日俱增。硬件加密硬盘数据的方法不依赖操作系统、不占用系统资源、具有安全可靠的密钥管理方式,成为当前保护硬盘数据的主要趋势。本
随着信息时代的到来和Internet应用的普及与深入,人们对传统信息服务提出了越来越高的要求。当今的信息服务已不能满足于广泛的一般用户对普通信息的要求,而是应该包括面向特
燃煤锅炉炉膛火焰温度场的测量与重建一直是一个难于解决的问题。本文探讨了声学法燃煤锅炉炉膛火焰温度场检测技术,并对其中的一些关键问题进行了研究,主要完成了以下工作:
Internet提供了可供访问的大量的孤立Web服务,将已有的Web服务进行组合产生更大的价值是目前应用Web服务的趋势。使用Web服务构建应用系统,需要使用面向接口编程的方式来进行开
由于传统的模型驱动架构(MDA)在企业级应用中还没有比较成熟的方法来解决不断变化的业务逻辑的开发,因此,MDA在实际应用中受到了很大程度的限制。本文将工作流建模技术引入到
大多数的网络应用采用单播传输数据包。随着Internet的普及和发展,产生了许多新的网络应用,这些网络应用基于组播通信模型。组播传输不仅提高了数据传送效率,而且减少了网络出现
随着互联网的发展以及信息化程度的逐步提高,信息安全威胁也呈现出多元化、复杂化的趋势。依靠单一的安全技术已经很难解决现有的信息安全问题,信息安全要靠一个包括防火墙、
商标检索与分类技术的研究,对商标注册、维护商标所有人的权益等方面具有重要现实意义。传统商标分类方法由人工文字记录、标记完成,这种分类方法工作效率低、分类误差较大,
软交换是在IP电话的基础上逐步发展起来的一门新技术或一个新概念。SIP是IETF推出的在软交换体系结构中一个重要的信令协议,SIP正以其简单,易于扩展,功能性强,受到越来越多的通信