基于列存储数据库的数据压缩研究与实现

来源 :吉林大学 | 被引量 : 0次 | 上传用户:emilyxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的主要工作是对列存储技术的研究以及数据压缩在其中的应用。具体内容有:分析和研究了列存储数据库的概念及其核心实现技术;研究主流轻量级压缩算法,提出了频繁段压缩算法,其在某些条件下可能比较优越;研究压缩态数据随机访问技术,并对Int-Packing算法进行改进,提出了Pack2、Pack3和Pack4压缩算法及其相应的压缩态数据访问算法,实验证明Pack3和Pack4极大地提高了压缩态数据访问的效率;研究压缩态匹配问题,对Huffman压缩态数据扫描进行了深入研究,从理论上计算出了在不同数据规模下用超字母表扫描Huffman压缩态数据时的最佳超字母长度,实验结果表明该理论值与实际基本相符,在实践中具有很大的指导意义。
其他文献
社区担负着连结个人与他人、家庭与社会的重要纽带作用,既是社会的缩影,同时也是研究整个社会的起点。在20世纪上半叶,中国城市社区以“单位办社会”为主的形式发展起来,单位
水库移民后期扶持项目管理对落实国家水库移民后期扶持政策,促进移民安置区基础设施建设,维护移民正常生产与生活以及移民群众稳定意义重大。本文在分析历年水库移民后期扶持