【摘 要】
:
目的——在目前的研究中,高维度高层次数据集构建数据立方体时会造成维度灾难问题。为了解决高维度问题,提出了寻找关键维度,只对关键维度进行数据立方体构建和存储;为了解决
论文部分内容阅读
目的——在目前的研究中,高维度高层次数据集构建数据立方体时会造成维度灾难问题。为了解决高维度问题,提出了寻找关键维度,只对关键维度进行数据立方体构建和存储;为了解决高层次问题,提出了对层次关键字进行层次编码,对细粒度的层次数据集进行存储,其中粗粒度数据集由细粒度数据集聚集而来。方法——采用改进的Apriori算法对关键维度进行寻找,得到维度频繁项集。采用改进的片段化处理方法,对片段内的数据采用层次维度和非层次维度的组合方式进行物化,对片段间的数据保留关联索引。研究结果——第一,寻找关键维度时通过建立倒排列表来减少在生成候选项集时需要对数据库进行扫描计数的I/O开销,并对倒排列表中的事务列表采用二进制表示以减小存储开销。第二,对关键维度进行片段化处理。在片段内对数据立方体完全物化,采取1个层次维度和多个非层次维度的组合方式来减少子立方体。同时对于层次关键字进行层次编码以减少数据的存储压力。研究的局限性——(1)寻找维度频繁项集,阈值的确定以及额外的时间和存储开销。(2)对于数据立方体没有涉及的维度,则需要去原始数据仓库中查询。实际影响——通过对关键维度数据立方体的构建减少了一些无效数据的使用,提高了数据立方体的构建效率。独创性——通过改进Apriori算法寻找维度间的关联关系,得到维度频繁项集。结合维度频繁项集进行片段化构建数据立方体。
其他文献
脂质体作为一种微粒类靶向制剂载体具有许多优良的特性,近年来在肿瘤化学治疗中的应用日益广泛。主要介绍几种具有代表性的蒽环类抗肿瘤抗生素多柔比星、表柔比星、柔红霉素
针对固定翼无人机的飞行控制律设计问题,提出了一种基于非线性PID控制原理的控制器。该控制器的比例、积分、微分增益是控制误差的非线性函数。确定该组函数的参数主要根据最
<正>当一只小小的花盆有了梦想,它也能拥有无限发展的未来空间。兰清泉是南京工业大学一名在读博士生,跟着导师做的都是高精尖的科研项目。但他创业时,却选择了一只小小的花
<正>日出东方上海晨光上海——中国东部海岸线上的璀璨明珠,享负盛名的国际经济金融、贸易与航运中心。作为国际化的大都市,上海在世界舞台上绽放日益夺目的光华。它如一扇明
本文主要分析了材质的特性,通过对材质的不同要求进行分析,并以案例来具体阐述涤纶材质和3M反光材质在户外产品中的应用。并且对比了不同材质筷子的优缺点,指出了氧化铝陶瓷
2008年的经济危机席卷整个世界,在复杂多变的经济环境下我国纺织业承受着巨大的压力,如何减少纺织企业财务风险,怎样规避财务风险,越来越受到纺织企业管理者的重视。
根据计算机模拟和实际拍摄的离焦模糊标准分辨力靶标图像,对提出的离焦模糊图像超分辨力盲复原算法进行了分析研究,对比了超分辨力盲复原算法与几种典型复原算法的效果,以及
报导了以牛血清白蛋白(BSA)为样品,对改良lowry法CBB法,改良Boratynski法、胶体金法、Smith法等五种微量蛋白质测定方法的灵敏度、稳定性、干扰因素及操作简单程度进行了比较.
<正> 对于甲状腺机能亢进症所致的心功能不全,治疗有一定困难。我用柴胡加龙骨牡蛎汤治疗本病8例,心功均恢复正常。 8例中,男2例,女6例,年令30-71岁。所有病例均经测定血中甲
从网球项目的动作剖析,完成挥拍击球等技术都涉及到运动者手臂的位移及发力,肩部在完成运动过程中形成运动损伤的可能性更高,其原因与运动者技能的学习过程中形成技术动作规