论文部分内容阅读
现有的HBase提供的MapReduce访问接口存在数据读取速度较慢的问题。针对此问题本文提出了一种改进方法,该方法不以原来的逻辑存储单元Region作为任务分配的基本单位,而是以HBase的物理存储单元Block作为任务分配的基本单位,并通过适当的调度策略,使得Map计算能够在数据所在节点执行。实验结果表明:该方法克服了原有接口无法保证数据本地性的问题,减少了网络开销,提高了访问速率。