论文部分内容阅读
介绍在传统检查点技术的基础上提出一种面向分布式共享主存结构计算机节点瞬时故障的动态检查点技术。通过对节点及其运行进程的实时监控数据的分析,给出检查点的引入、保存、恢复和取消的容错技术策略。同时分析该技术在一定的故障模型下,对不同应用程序的有效程度及其应用开销。目的是希望使检查点序列在覆盖故障点的同时,尽可能降低保存检查点的次数,提高系统运行效率。