论文部分内容阅读
按照时间延续性划分,故障可分为永久性故障、间歇性故障和偶然性故障三种。根据国外有关资料统计表明,间歇性故障和偶然性故障的发生几率几乎占所有现场失效的90%,因而也成为系统出错的主要根源。因此,研究具有自检测自修复功能的故障检测及容错技术方案具有非常重要的意义。目前可编程逻辑器件中基于SRAM型FPGA的使用率非常高,但由于其结构的特殊性,在太空或其他高辐射环境中易受到单粒子的轰击,这种单粒子事件会造成逻辑信号状态翻转和逻辑功能的改变,严重时甚至会造成部件的永久性损坏和系统失效。传统的容错设计都是基于三模或多模冗余表决的方法进行避错,并不能从根本上纠正错误,残留的故障部件会造成故障隐患和资源浪费。本文在FPGA动态部分重构的技术原理上设计了一种改进式的双模冗余自检测自修复系统,该系统采用了双模块比较的容错模式,并在每个模块上添加基于奇偶校验技术的自检测功能,故障发生时刻该系统能够及时发现,并通过重构空闲备份模块介入系统来保证系统的持续运行,同时被切断模块通过自检能够迅速判断是否故障,并在确定故障后通过动态重构技术进行自我修复。整个系统的运行不会因故障产生而中断,而检测及修复也都在系统运行状态下完成。本文通过具体模块功能设定实现该系统,并通过故障仿真及平台验证证实系统具备单模块故障及双模块不同故障的容错、检错及修复能力。本文主要阐述基于动态部分重构技术的双模自检测自修复系统的设计及SoC的软硬件结合的控制实现。首先对现有容错及动态重构技术原理进行阐述,讨论本课题的研究意义;其次,介绍FPGA基本架构和易受辐射干扰的原理;再次,通过对动态部分重构技术和容错技术的分析,推出本文的容错、检测和修复功能模块设计;最后,系统地阐述了系统整体设计以及每个模块部件的具体实现方法,并通过仿真和测试对设计进行验证分析。