基于DRA的不确定数据的查询研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:penguin669
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着不确定数据的大量产生,如何从不确定数据库中进行Top-k查询成为一个急需解决的问题。由于不确定数据概率维的存在,使得它和传统的确定性数据在处理方法上有很大的不同,准确并高效解决不确定数据的查询问题具有重要意义。本文首先详细介绍一下不确定数据的产生的原因,及其特点,比较一下它和确定性数据的不同之处。之后总结了现有针对不确定数据的查询处理模型和处理方法,并指出这些模型存在的问题,以及现有方法的优缺点。本文不仅对现有的处理不确定数据的Top-k方法进行系统的研究,而且还比较了Skyline查询和不确定数据Top-k查询之间的关系,并采用已有的Skyline的方法来解决不确定数据的Top-k查询。最后,提出使用元组之间的DRA关系来改进现有的方法,该思想是通过元组的分值和概率值之间的大小关系来确定元组之间的控制关系,从而使得一些被控制的元组可以直接排除,不参与Top-k查询的计算,使得现有的查询方法可以更加高效的得到准确的结果。本文提出的使用元组之间的DRA的关系来提前删掉一些不可能成为结果的元组,使得查询过程更加简单。另一方面,对于某些数据经常更新变化的数据库,这种方法表现出更加优秀的效果,可以直接判断发生变化的元组能不能对查询结果产生影响,这样就节约了重新查询所需要的时间和空间。实验结果表明本文所提出方法能够更好的满足用户对于搜索结果的快速和准确的要求,搜索效率提高了。
其他文献
这些年来,网络的迅速发展给人们的生活带来极大的便利的同时,也带来了许多安全性问题,木马、蠕虫等问题层出不穷,严重威胁着人们的财产安全。其中网络协议作为网络通信的主体成为
本课题针对网构软件系统独有的基本特征,研究网构软件在复杂开放网络环境下的可信性问题。结合其演化性的特点,根据模糊理论、信息熵理论、演化博弈理论、生态进化理论以及经典
多跳无线网络技术的发展满足了人们随时随地进行组网的需求,为人们提供了更加高效、便捷、灵活多样的网络接入方式。其自组织、自配置、自愈性等诸多特点使其能够有着较快的部
无线传感器网络(WSNs,WirelessSensorNetworks)是由随机分布在陆地、水域或者其他地区的传感器节点自组织形成的无线网络。节点受能量、体积及价格的影响,其计算能力、存储能量
近年来,由于网络应用系统的普及,软件系统的质量特别是对隐私性的要求越来越受到人们的重视,软件工程领域的一个主要挑战就是使用户信任日常生活中所使用的软件系统,可信的软件系
随着信息技术的快速发展,及企业信息化建设的需求,IT服务管理(ITSM)在企业运营管理中所起的作用越来越重要。信息技术基础架构库(ITIL),作为IT服务管理最佳实践指南,提倡以流程为
随着虚拟现实技术引起越来越多的关注,以及计算机图形学与计算机软硬件快速的发展,2016年被定义为VR/AR元年,广大虚拟现实技术的学者和计算机软硬件厂商都投入到了虚拟现实技
现代技术特别是高技术条件下的局部战争中,如何能够迅速、准确地获取瞬息万变的战场信息,已经成为决定战场胜负的重要因素。随着计算机和网络技术的迅速发展,作战指挥方式已从传
语音识别技术是机器学习领域的一个重要研究方向,在现实生活中有着广阔的应用前景。随着移动互联时代的到来,移动终端成为主要的人机交互平台,语音识别技术在移动终端上的应用越
特征选择和聚类算法是文本分类领域的两个重要问题,特征集的大小与好坏决定了信息处理的速度和精度,聚类算法决定了文本分类结果的正确率。但是,当前的特征选择算法存在着需要预