【摘 要】
:
随着传感器网络的快速发展,环境监测等数据流应用越来越多的依赖于云服务。如今许多云服务部署在地理分布式基础设施上,即位于不同地区的云数据中心,以获得更好的性能。地理
论文部分内容阅读
随着传感器网络的快速发展,环境监测等数据流应用越来越多的依赖于云服务。如今许多云服务部署在地理分布式基础设施上,即位于不同地区的云数据中心,以获得更好的性能。地理分布式云中的作业处理需要将所有待处理数据转移到作业所在云数据中心,放置数据的时间过长会导致作业延迟增大,从而增大数据流应用的响应时间。地理分布式云中数据放置完成后,调度作业到各个云数据中心进行处理,在云数据中心执行作业过程中可能会因为落后任务花费很长时间导致整个作业的执行被拖延。如何在地理分布式云中有效地放置数据和处理作业执行过程中产生的落后任务成为亟待解决的问题。因此研究地理分布式云中面向数据流应用的数据放置和容错调度方法具有较高的理论和实际应用意义。针对以上应用场景和问题,本文从以下三个方面展开研究:(1)为了有效降低数据放置过程中的数据传输时间和数据传输带宽成本,同时满足各个云数据中心的容量限制和地理分布式云的负载均衡,本文设计了基于拉格朗日松弛的数据放置算法。该算法首先在成本、容量和负载均衡三个限制条件下,对地理分布式云中数据放置问题进行数学建模。然后将地理分布式云系中数据传输成本问题转化为带权有向图的多源最短路径问题,采用Floyd算法对数据传输宽带成本限制进行求解。最后将数据放置目标函数由复杂整数规划问题转化为线性规划问题,并通过拉格朗日松弛法求解传输时间最小的数据放置方案,实现了减少数据传输时间和数据传输带宽成本,保持系统负载均衡的目标。(2)为了提高作业在各个云数据中心的执行效率,本文提出了一种基于推测执行的容错调度方法,该方法包含任务副本创建和任务调度算法两个部分。对于任务副本创建,考虑集群不同的负载状态,设计了两种策略:基于任务克隆和基于异常检测的任务副本创建。基于任务克隆的任务副本创建方法在任务执行前,根据作业截止时间和集群资源状态创建任务副本,然后同时执行所有副本。基于异常检测的任务副本创建方法在任务开始执行后,根据任务的剩余执行时间和任务的备份收益判断该任务是否为落后任务,并在其他节点上重新执行落后任务的副本。将上述推测执行模型与Spark平台中的公平调度算法结合构建了基于推测执行的容错调度算法,实现了缩短作业完成时间,提高集群吞吐量和QoS满意率的目标。(3)对所提算法进行实验验证与对比分析。在地理分布式云中基于拉格朗日松弛的数据放置算法的实验中,将本文算法与Hash算法、Closeset算法和CRANE算法进行对比。实验结果表明,本文算法能有效降低数据传输时间和数据传输带宽成本,同时提高了负载均衡度。在Spark集群中基于推测执行的容错调度算法的实验中,将本文算法与Spark-Speculation、LATE算法和SCA算法进行对比。实验结果表明,本文算法缩短了应用平均完工时间,同时集群资源消耗得到了一定减小,集群吞吐量和QoS满意率也得到了一定的提高。
其他文献
随着无线通信技术的飞速发展,卫星通信技术在社会的各个领域得到了广泛的应用。卫星通信是地面通信的重要补充和延伸,可以在海洋、沙漠等无法建造地面基站的地区提供通信服务。但是面对日益复杂的电磁空间坏境、对通信卫星有意无意的干扰问题,如何快速准确的对干扰源进行定位显得尤为重要。首先,本文对卫星通信系统中基于时差和频差联合的无源被动定位技术及系统进行综述,分析了无源被动定位技术的研究背景和意义,同时对无源被
随着社交平台的日益普及,微博因其文字短小、传播速度快受到了广大网友的喜爱,微博文本中蕴含的海量信息也从商业、政治、娱乐等不同方面带来了巨大价值,从而引发了学者们对
在大数据时代,用户的隐私保护是一个关键问题。作为数据挖掘的经典算法,原始k-means算法常用于对明文数据进行聚类分析,没有考虑到隐私保护的问题。已有工作研究支持隐私保护的k-means算法,但是一般有计算成本高(例如加密算法),精度损失大(例如数据扰动方法),通讯成本高(例如安全多方计算)等缺点。负数据库作为一种新型的数据表示方法,存储的是原始数据库补集中的信息,其难以逆转的特性可以用于保护原始
随着社会经济的快速发展,人们日常生活中的决策活动越来越复杂。因决策环境信息的不确定性和人类认知的模糊性,现有决策活动往往存在着不确定性信息,属于模糊决策问题。区间
随着互联网与智能制造的深度结合,计算机虚拟现实技术得以快速发展,碰撞检测技术作为虚拟现实技术中的重要环节,对智能制造生成效率和质量提高有着重要作用。五轴数控加工作为智能制造产品的重要加工手段,广泛应用于航空航天、汽车、船舶零部件生产领域中,在加工过程中由于增加两个旋转轴,提高灵活性的同时使得加工过程更加复杂难以预测从而引起数控系统干涉碰撞,影响零件加工效率和质量。目前国内外学者对碰撞检测进行大量研
生物活性分子,如抗坏血酸(AA)、氧化型谷胱甘肽(GSSG)和碱性磷酸酯酶(ALP),广泛的存在血清和中枢神经系统中,在人类新陈代谢过程中发挥着重要的作用。谷胱甘肽(GSH),是一种由
近年来,我国油气勘探的重心已经逐渐由常规储层转入深层、超深层储层领域。这类储层钻遇探井较少,井中资料比较稀缺,缺乏基础的岩石物理数据。本文以阿克苏地区塔里木盆地的
19世纪初期,为了解决国内的自由黑人问题,一批政治家们成立了美国殖民协会(American Colonization Society)。它的目标是执行海外殖民计划——将美国的自由黑人运输到非洲大陆。美国殖民协会成立后,就开始谋求联邦政府的资助并且采取了多种措施来获取民众的支持。到1820年代末30年代初,海外殖民事业已取得了长足的进步。与此同时,1820年代末、1830年代也是奴隶制问题开始发酵并
学术研究和数字图书馆的快速发展导致网络上学术论文急剧增多,如何为学者们提供个性化的论文推荐服务成为了数据挖掘领域的研究热点。本文基于深度学习技术从增强论文和用户
目前图像分类任务在CIFAR-10、CIFAR-100和ImageNet等大型通用数据集上获得最优表现的均是基于深度卷积神经网络的方法,但深度卷积神经网络依赖大量已标注的训练样本来优化,