论文部分内容阅读
当前,在海量数据的计算需求以及规模经济效应的催生下,云计算技术得到了广泛的研究与应用。但是,云计算技术远未达到成熟完善:从云计算用户的角度看,存在着建模应用复杂、流程性操作繁琐等问题;同时,云计算事务已逐渐成为用户需求流程中的一个环节,而非独立的用户目标;从云计算执行性能效益的角度看,仍存在着很大的改进与提升空间。总而言之,如何在顺应新的用户需求,且保持甚至提高服务质量的前提下,压缩运行成本以达到收益最大化,这是目前云计算技术亟待解决的问题。本文提出了一个集成云计算与工作流的解决方案——面向云计算的工作流系统。工作流集成云计算可以带来以下性能优化:就用户而言,云工作流提供了对复杂应用的抽象定义、灵活配置和自动化运行;就云服务提供商而言,云工作流可以提供任务的自动调度、资源的优化配置和管理。本文首先介绍了面向云计算的工作流系统的总体结构,重点介绍了分布式工作流引擎以及基于Hadoop的底层云计算实现模块的架构方式与组成细节。接着,给出了一种基于动态矩阵控制的工作流动态自配置算法。该算法应用于分布式工作流引擎的自配置调度,可以实现系统性能的可伸缩,将系统总体性能维持在一个平稳较优的水平上。而后,文章详细介绍了Hadoop模块的结构、部署,并重点给出了Hadoop集群作为云计算载体与云工作流系统的集成方法,主要包括:云事务的建模、Map/Reduce函数的客户端生成、支持异步调用的工作流引擎,以及引擎与Hadoop通信的webservice实现。最后,本文给出了面向云计算的工作流系统的实现原型,重点介绍了相关调度算法、以及工作流与Hadoop集成方面的具体实现。同时以药物筛选服务为应用实例,介绍了系统原型在实际应用中的操作流程以及运行结果。实际应用表明,面向云计算的工作流系统可以简便、有效地对云计算事务建模、执行。并且性能稳定、较优,具有较好地可用性、可靠性、可伸缩性以及界面友好。因此我们认为面向云计算的工作流系统具有较好的应用前景。