论文部分内容阅读
随着云计算基础设施的发展和研究的深入,在云计算环境中开发了越来越多的功能强大、需要大量资源的科学计算流程、商业流程和协同应用流程,云计算应用流程也越来越复杂,且受时间、代价和资源等多种因素约束。云工作流可以方便灵活地构建、执行、管理和监控云计算应用,使得云计算应用能够高效自动执行。云计算环境与传统计算环境最大的不同之处是按需随时获取计算服务并按使用付费,同时由于云计算的动态性、分布性、异构性和自治性导致传统工作流的方法和技术不能有效的处理云工作流管理中的有关问题。云计算环境是面向服务的,硬件、平台及软件都是以服务的方式提供。付费使用模式促进了云环境中服务种类和数量的迅猛增长,为云工作流的运行提供了良好的物质基础。传统环境或网格环境中web服务选择、组合和调整的研究已经取得一定的研究成果,但云计算环境中如何利用web服务更好地执行云工作流仍是面向服务计算和工作流领域的研究热点。本文根据工作流的特征,结合用户的偏好,提出调整感知的web服务组合策略。调度策略和调度算法是云工作流引擎的核心组成部分。与网格环境不同,由于云计算环境面向市场的特征,云工作流调度算法的目标函数不仅要考虑运行时间,还要考虑运行成本。调度问题的本质是发现适合于给定任务的候选虚拟机集合,从这些虚拟机集合中选择合适的子集,并将任务与虚拟机进行映射。该映射应当满足预先定义好的调度约束(通常考虑运行时间和运行成本),找到这样的映射是NP完全问题。对于云工作流的调度来说,由于任务之间存在时序依赖或因果依赖,在调度时需要考虑的约束条件比一般云计算任务调度更复杂。论文的主要工作和创新点如下:1)根据云工作流服务资源的QoS性质,考虑工作流活动的重要性,结合用户的偏好,提出一种调整感知的云工作流服务资源组合算法,提高云工作流执行的成功率。将云服务组合分为云服务选择和云服务调整感知组合两个阶段。在选择阶段,考虑运行时间、运行成本、服务可靠性和服务信誉等多约束条件下,设计了多目标蚁群算法,求解满足用户非功能性需求的Pareto解集和优化解;在组合阶段,根据用户的QoS需求选择一些备份服务,当发生运行失败时,可以从备选的服务中选择相应的服务进行切换,使得运行失败可以得到迅速恢复。调整感知策略根据用户的偏好,从服务信誉度(Reputation)、服务可靠性(Reliability)、任务的重要性(Criticality)等几个角度讨论哪些任务需要进行服务预定,以及预定服务资源的QoS特征。2)针对云工作流活动运行时间的非线性特征,提出基于混沌时间序列的云工作流活动运行时间预测方法,该方法利用相空间重构理论和RBF神经网络实现对非线性时间序列的预测。云工作流活动的运行时间往往受系统性能、网络状况等多种因素影响而呈现非线性特征,线性时间序列方法无法对其进行有效预测。本文采用坐标延迟法进行混沌时间序列的相空间重构,嵌入维数由Grassberger和Procaccia提出的G-P算法来确定,采用自相关函数法确定时间延迟值,采用正交最小二乘法作为RBF网络的学习方法。3)提出基于智能算法和调整感知云服务资源组合策略的云工作流调度策略,实现云工作流任务的两层调度。云工作流是在服务提供者所在数据中心的虚拟机上运行的,因此,云工作流的任务调度应当分为两个层次进行,分别是服务层调度和任务层调度。在服务层调度中,我们提出将云工作流应用分解为若干任务或任务集合,这些任务或任务集合之间的结构相对分解前要更简单,甚至大部分任务之间是可以并行执行的,这些任务以任务包的方式形成任务单元。服务层调度实际上就是为这些任务单元选择合适的服务资源,我们称这种方法为Package-Based调度。任务层调度的任务数量并不多,但是由于虚拟机是共享的,在分配任务的时刻虚拟机上正运行着其他任务,所以涉及到的任务数量会很大。我们研究了三种有代表性的智能算法(遗传算法,蚁群算法和粒子群算法)并加以设计和改进,用来进行调度优化,根据这三种算法的性质,我们提出基于智能算法工作流活动的调度策略。4)提出基于时序一致性模型与任务完工时间预测模型的云工作流任务的再调度策略,解决云工作流在执行阶段出现的可恢复时序违背问题。在云工作流的运行阶段,分配在数虚拟计算资源上的任务可能会发生时序违背,如果不能有效的及时调整,可能会导致云工作流任务不能按照用户服务质量约束及时完成。这样不仅会影响整个云工作流的及时完成,而且会影响服务提供者的信誉。大部分时序违背是可以通过再调度来消除其影响,从而使得云工作流可以在服务质量约束内完成。时序一致性模型被用来统计分析工作流运行质量,并在该模型基础上定义了可恢复的时序违背。再调度的策略是从调度阶段所得到的候选解集中选择对于出错子工作流来说具有最优QoS的调度,并将出错子工作流任务重新进行资源分配。再调度阶段只是对候选解的查找,所需时间很短,对系统的影响较小,所以该策略可以用于云工作流的在线再调度。本文在云工作流关键技术方面进行了探索和研究。以云工作流管理为应用背景,研究了云工作流服务资源组合模型、完工时间预测算法以及云工作流的调度和再调度策略。本文的研究不仅在云工作流管理方面具有重要的实际应用价值,在云计算研究方面也具有较大的理论意义。