论文部分内容阅读
<正>在分与合技术之间传统的IOE架构和虚拟化技术存在着瓶颈,当服务器读取数据进行计算的时候必须要把数据移动到服务器上进行计算,这个过程是有瓶颈的,磁盘瓶颈和带宽瓶颈。计算能力可以通过横向扩充机器解决,但是IO能力是受限制的。Hadoop将一个文件切成很多小的文件分别存在不同硬盘上,计算时通过存储HDFS组建,把存储整合成一个大的集群。