对多维数据存储技术的研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:p_y112233
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在目前激烈的市场竞争中,企业要想在竞争中立于不败之地,决策者必须要做出快速、及时、准确的决策。这些决策的选择不再仅依据决策者的主观感觉和经验,更主要来源于对企业过去业务数据的分析,他们需要对这些数据进行不同角度的分析。根据对这些数据的分析结果,预测未来的商业趋势。若要有效、高效的分析历史数据,就必须对其进行合理的组织与存储。 本文讨论了数据在磁盘中的存储以及组织结构,同时,为了提高查询分析的效率,还要为数据文件建立多种索引;要对多维数据仓库中的多维数据进行粒度的划分;对数据进行分割;对休眠数据进行处理等。粒度是数据仓库中数据单位的细化或综合程度的级别,越详细的数据粒度越小。粒度越大,查询效率越高,占用的存储空间少,但能完成的查询也就越少。数据分割是对数据仓库中的细节数据进行分割,通常的分割标准有:按时间分割、按地理位置分割等。数据量的大小是决定分割的主要因素。休眠数据管理是指对以后不用的数据从要进行查询分析的数据仓库中剔除。这样可以在查询时减少扫描的次数从而提高效率。 这里介绍了两种方法可以存储多维数据,一种是以二维关系表的形式存储,一种是以多维数组的形式存储,分别对应ROLAP与MOLAP。关系表存储法也就是用维表和事实表存储多维数据。用维表记录多维数据中的维度,用事实表记录多维数据立方体各个维度的交点的度量值。由于在查询时要进行多个表之间的连接,因而响应时间比较长,但对于有大量空白数据的数据库来说,可以节约很多存储空间。多维数组存储法是直接处理存放在多维数组中的数据,这种数据已经反映了各种数据的组合,并且每个单元都可以直接访问,一般而言,查询速度比较快而且稳定。但在矩阵稀疏的情况下,会存在大量的数据空白点,从而造成大量的空间浪费。针对MOLAP中出现的空间浪费问题,我们要对其进行压缩存储。可以通过增加一个冗余的标志位的方法记录某种组合是否有实际可用的数据,在存储时只存储有数据的点,剔除空白点,达到压缩存储多维稀疏矩阵的目的。
其他文献
椭圆曲线密码是公钥密码的发展趋势,椭圆曲线密码算法的快速实现问题是椭圆曲线密码尚待进一步研究的关键问题,利用基于有限域上的椭圆曲线密码可以实现数据加密、密钥交换、数
随着计算机技术的飞速发展,计算机的应用领域正以空前的规模扩展着,计算机图形学在这种大力推广中也起到了很大的推动作用。在计算机图形学和几何造型中,常会遇到一些较为复
联合视频工作组JVT(JointVideoTeam)于2003年正式提出了新一代视频压缩标准H.264/AVC。H.264/AVC标准支持从低带宽、高误码率的无线移动视频通信到高带宽、低误码率的有线视
近年来,随着数字化医疗器械的发展,极大地推动了我国医疗水平的提高,但同时这些数字化医疗器械大多基于PC架构,且具有成本耗费高,体积大等特点。针对这种情况,本文将通过研究肿瘤细
人脸检测是指从图像或者图像序列中找出单个或多个人脸的位置和大小的技术,是机器视觉的一个非常重要的研究方向;人脸特征提取是指把人脸图像高维的原始特征变换或映射成其低维
随着计算机技术、移动通讯技术和互联网技术的迅速发展,移动数据库得到广泛的应用。公共信息发布的应用中,分布广泛的数据库系统通过广播向客户端发布数据,客户端监听广播信道,当
人们对移动通信应用的需求推动了移动通信技术的发展,至今移动通信技术已走过了两代的历程,即八十年代的第一代模拟技术和九十年代的第二代窄带数字技术。近些年来,随着无线通信
现实生活中有很多最优化问题,这些问题往往又是多目标性质的,各个目标之间相互制约,在对其中一个目标优化的同时,是以降低其他目标性能为代价。所以总体来说,多目标优化问题并不存
椭圆曲线密码系统(ECC)是迄今为止每比特具有最高安全强度的密码系统,它的安全性基于椭圆曲线离散对数问题的难解性。与其它公钥密码系统相比,椭圆曲线密码系统除了安全性高外,
网关作为最常见的网络设备之一,连接着多个差别很大的网络,同时处理着网络间大量的数据流,其性能直接关系到网络用户的通信质量。传统的网关主要基于专用集成电路解决方案(ASIC)