【摘 要】
:
MapReduce已经发展成为大数据领域标准的并行计算模型.理想情况下,一个MapReduce系统应该使参与计算的所有节点高度负载均衡,并且最小化空间使用率、CPU和I/O的使用时长以及
论文部分内容阅读
MapReduce已经发展成为大数据领域标准的并行计算模型.理想情况下,一个MapReduce系统应该使参与计算的所有节点高度负载均衡,并且最小化空间使用率、CPU和I/O的使用时长以及网络传输开销.传统的算法往往只针对上述指标中的一种进行优化.在保持算法良好并行性基础上,对多个指标同时进行优化,提出了MapReduce 优化算法的设计规范.针对数据处理领域最重要的排序算法进行理论分析,给出了多指标约束下的最后算法,并证明了该优化算法满足MapReduce优化算法规范.最后通过实验验证了优化的排序算法的有
其他文献
档案数据库是档案现代化建设的基础工作,是以计算机为手段管理档案数据的一种现代手段,是传统的档案工作与现代科学技术相结合的产物.随着科学技术的发展,档案数据库得到了广
为获得旅行商问题(Traveling Salesman Problem,TSP)的最优解,提出利用改进的粒子群优化(Improved Particle Swarm Optimization,IPSO)算法中求解TSP问题。IPSO算法采用了粒子自
目前国内外已经开展了大量针对同步卫星互联网的传输控制技术研究,提出了很多传输控制协议方案。然而,这些协议方案在信道条件更加恶劣的行星际互联网中的性能表现并不理想。
直方图均衡是常用的图像对比度增强技术.然而直方图并不包含任何空间颜色的分布信息,因此其在图像编辑方面的应用还很局限.为了解决这个问题,可以采用空间直方图技术以实现跟