星载计算机容错和重构技术研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:luck88888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
星载计算机(On-Board Computer,OBC)是卫星中完成控制和计算任务的现代数字计算机系统,它是卫星综合电子系统的控制和管理中心,在民用和军用领域都发挥着重要作用。星载计算机对可靠性有非常高的要求,本文采用冗余容错和重构纠错技术,研究了基于FPGA的星载计算机的系统可靠性设计方法。   可编程器件(如FPGA)具有开发周期短,开发成本低,灵活性高,可重复编程等特点,在星载计算机设计中应用日趋广泛。星载计算机长期工作在太空环境中,经常受到空间高能粒子的辐射干扰,因此必须采取一定的可靠性设计技术,以便及时处理因辐射引起的故障。传统的故障处理方式是硬件的冗余容错,如三模冗余方法、静态备份方法,以及两者相结合的混合容错方法。但是三模冗余和静态备份方法在可靠性提升方面作用有限;混合容错方法虽然可以得到较好的可靠性,但资源冗余严重,难于在实际系统中使用。   基于上述问题,本论文提出了一种基于局部动态可重构的三模冗余方法,该方法对可编程器件采用三模冗余方法进行容错设计,并将三个冗余模块的bit文件保存在片外存储器中。当某一模块出现故障后,系统会调用相应的bit文件对该模块进行局部重构修复,修复的过程不会影响其他模块的正常运行。同时,为了解决冗余模块之间的状态同步问题,本文提出了一个状态寄存器复制机制,重构后的初始化模块可以自动复制相邻模块的状态寄存器,尽快与系统完成同步。分析和实验表明,和已有方法相比,基于局部动态可重构的三模冗余方法可以显著提高系统的可靠性,同时资源开销仅相当于三模冗余的消耗。   同时,本论文也在系统级可靠性设计方面进行了研究,提出了一系列的可靠性设计方法,如存储模块的EDAC设计,通过增加冗余存储资源的方式进行ECC校验;FPGA的回读设计,通过回读FPGA内部配置存储器的数据来检测是否发生故障;关键器件的看门狗设计,对关键芯片进行状态监控;板卡的电压和温度监控设计,保证系统的电气特性正常。通过对星载计算机进行全面的状态监控和故障检测,保证其长期的可靠运行。
其他文献
多年的企业信息化建设,企业内部已经建立许多分散孤立的应用系统,随着业务规模不断扩大,集成已经成为当今企业的迫切需求。但是企业应用一般都由运行在不同操作系统,多个层面
本文的研究工作是围绕综合型语言知识库建设展开的,包括两部分:综合型语言知识库系统原型的开发与中文缩略语知识库建设。 北京大学计算语言学研究所(ICL/PKU)十多年来积累
随着互联网上相同或相类似功能的Web服务数量的日益增多,用户对Web服务服务质量QoS的要求也不断提高。在实际应用中,服务提供方、服务使用者、服务质量等诸多因素的不确定性
随着高性能计算技术的迅猛发展,机群系统在航空航天、石油勘探、气象预测等领域的应用越来越广泛。在2007年11月全球高性能计算机Top500排名中,机群系统结构占总数的81.20%,并且
随着定位技术的不断提升和定位设备的大量普及,获取人与物体的位置信息变得愈加便捷。与此同时,随着物联网(Internet of things)技术的不断成熟,通过海量的传感器定时发送相关数
近年来,随着计算机网络与通信技术的快速发展,P2P网络模式以其可扩展性、高度容错性等突出优点变得越来越流行。在仅有的几年时间里,P2P应用已发展成为了占用Internet流量的
计算机的使用越来越普及,但信息安全缺陷所引发的问题却越来越显著。因此,在生产生活中对信息安全产品、科研、教育和培训的需求越来越旺盛。随着信息安全相关的产品开发、研究
无线传感器网络的应用前景十分广阔,能够广泛应用于军事、环境监测、医疗健康、交通管理以及商业应用等领域。虽然传感器节点有着各种各样不同的应用,但这些应用对传感器节点有
机群I/O设备共享是机群管理的一个重要部分。目前占市场主流的基于纯软件系统实现机群I/O设备共享的方式在系统的跨平台特性,可扩展性,对服务器资源的占用等方面存在不足。随着
在Web和企业信息化等领域,XML已经被接受为一种标准的信息交换格式。XML的自描述,与平台无关的特性使得它被用作不同系统间通信的数据格式,如用于Web Services中SOAP消息的载体