论文部分内容阅读
本文的主要工作是对列存储技术的研究以及数据压缩在其中的应用。具体内容有:分析和研究了列存储数据库的概念及其核心实现技术;研究主流轻量级压缩算法,提出了频繁段压缩算法,其在某些条件下可能比较优越;研究压缩态数据随机访问技术,并对Int-Packing算法进行改进,提出了Pack2、Pack3和Pack4压缩算法及其相应的压缩态数据访问算法,实验证明Pack3和Pack4极大地提高了压缩态数据访问的效率;研究压缩态匹配问题,对Huffman压缩态数据扫描进行了深入研究,从理论上计算出了在不同数据规模下用超字母表扫描Huffman压缩态数据时的最佳超字母长度,实验结果表明该理论值与实际基本相符,在实践中具有很大的指导意义。