论文部分内容阅读
查询海量数据有压缩和索引两种方法来提高速度,该文结合这两种方法提出了压缩查询的方法。FM-index是一种自索引的全文查询算法,存在内存占用过大的问题,对于复杂的查询效率也不理想。该文提出分块FM-index算法,在分块的基础上采用MPI对算法进行并行化,解决了内存占用过多的问题,达到了较好的并行效率。