论文部分内容阅读
随着大规模分布式并行应用的兴起,越来越多的计算机加入其中,极大的提高了系统的计算能力。而另一方面,计算机自身的不稳定性,给系统带来了许多隐患,降低了系统的可靠性。恶意的计算节点以及第三方节点的攻击,对系统的安全构成了很大的威胁。计算的正确性和安全性已经成为大规模分布式并行计算所关心的首要问题之一。ProActive是一个由法国的INRIA开发的分布式并行计算的纯Java类库,ProActive提供了大量的技术来简便网格和网络环境下应用的开发。本文在ProActive环境下,针对分布式并行计算的安全问题和容错问题,对容错技术、信任度技术、容错调度模型、信任管理模型、容错调度算法、子任务备份等技术进行研究。利用上述方法提出了一个引入信任度的容错调度模型的设计方案,改进了原有的并行计算平台WPHPC,并在改进后的平台上进行了实验。实验表明,引入信任度的容错调度模型在不增加额外资源的前提下,提高了系统的可靠性和安全性。本文的主要的工作:①在原有的并行计算平台的基础上,设计了容错任务的调度模型及三种容错调度算法,并且对容错调度算法下矩阵相乘计算模型的进行了实验分析比较,结果表明:在系统不增加额外资源的前提下,容错调度模型在计算节点失效的情况下依然保证了计算的正确性,提高系统的可靠性。②在原有容错调度模型的基础引入信任度机制,并提出了一种新的基于信任度的容错调度模型。再对矩阵相乘计算模型进行了实验分析比较,表明基于信任度的容错调度模型提高了系统中高信任度计算节点的利用率,提高了系统的安全性和健壮性。③在之前这设计的容错调度模型的基础上,改进了原有的并行计算系统,设计和实现了一个具有容错功能的系统的原型。