星载流水并行任务的故障恢复技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:weyyiverson
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着空间应用越来越复杂,在轨处理的数据量越来越大,甚至呈现指数级增长的趋势,当单个处理单元的计算平台已经远远不能满足大规模星载应用的计算需求时,星载多处理机平台可望为大规模星载应用程序的高性能计算提供必要的硬件平台。当然,为了更加有效地利用多处理单元的硬件并行平台提高星载应用的计算性能,需要将以前的串行星载应用程序用并行的编程方法重新实现,从而在软件手段上配合并行的硬件平台提高星载应用程序的计算性能。而流水并行处理作为并行处理的一种有效方式被广泛应用在包括航天在内的诸多领域,例如天地传输中的无线传输领域和星载多媒体图像处理应用等方面,可见实践已经证明流水并行处理已经在星载计算机的诸多方面得到有效的应用并极有效地提高了星载应用的计算性能。同时,众所周知,来自宇宙空间深处和太阳活动产生的宇宙射线使得外空间环境变为一个充斥大量辐射的复杂环境。这些宇宙射线中带有大量的带电粒子比如电子、质子、a粒子和重离子,当这些带电粒子轰击航天器材的时候可能会导致单粒子效应,从而导致星载应用在计算过程中出现计算结果错误等各种故障。所以对星载流水并行应用来说,在其满足了星载应用高性能计算的同时对程序本身的可靠性提出了新的需求。容错技术是提高星载应用可靠性的主要和有效手段。容错技术可以分为硬件容错和软件容错,而软件容错具有性价比高等诸多优势,相比硬件容错而言得到了更广泛应用。在软件容错中,又包括故障检测和故障恢复两大部分,可以说故障恢复是保证星载流水并行任务的重要手段。目前星载应用的故障恢复策略主要就是重启发生故障的计算任务甚至是重启整个系统,显然使用这样的手段来对星载流水并行的应用进行故障恢复会导致故障恢复之后大量的重复计算从而极大地降低了星载应用的计算性能。为了克服上述的缺陷,使得故障恢复机制也能更加适合星载流水并行任务,本文针对星载流水并行任务进行研究,提出了一种细粒度的故障恢复机制,在故障恢复的过程中减少故障恢复后星载流水并行任务的重复计算,在保证星载流水并行任务可靠性的前提下提高了故障恢复的效率,使得因故障恢复带来的星载流水应用的计算性能消耗尽可能地减小。本文在VxWorks嵌入式系统中,模拟了共享内存和分布式内存的并行环境,然后以流水并行JPEG图像压缩程序为实例,对本文提出的故障恢复机制进行了有效性验证,并对故障恢复效率进行了性能评测,确保了恢复有效性的前提下,提高了故障恢复的效率。
其他文献
本文针对现有环境遮片技术中仍然存在的一些问题和局限性进行研究,提出了环境遮片提取与合成的一些新的算法与实现方法。主要工作包括:(1)提出了辐射度空间上的环境遮片提取与
色彩模式转换器是图像处理软件中的一项重要内容,包含色彩模式转换和图像上当前焦点的颜色信息提取这两部分的内容。为了更好的理解色彩模式转换器的作用,文章中着重讲述了色彩
本文较全面彻底地对中国Web Graph作了研究,包括中国Web Graph的静态属性的统计分析以及其动态演化分析,并且将其和全局Web Graph作了比较。在对中国Web Graph做静态属性的统
随着航天技术和信息技术的迅速发展和应用,空间在政治、经济和军事等领域的战略地位日益提高,空间信息优势将成为国家和军队强大的关键因素,因此,我国提出要建立和发展卫星综合信
近年来我国公路事业得到飞速发展,但因公路工程的地域分布和工程数据的实时更新,使得对整个公路工程项目海量数据的管理变得异常复杂。如何借助现代化信息处理技术加强对公路工
近年来,社交网络、电子商务、在线视频、大容量网盘等新一代互联网应用发展迅猛,这些应用具有数据规模大、业务增长快等特点,需要越来越多的高性能服务器支持,软硬件维护成本
微博作为近几年来最热门的社交网络平台之一,其用户数量、用户活跃度、都以惊人的速度持续增长着。微博上的信息传播具有核裂变式的特点,信息产生速度快、传播速度快。微博的
明天的计算将进入普及计算时代。各种消费电子产品,包括智能手机,PDA,Web-TV,将来的信息家电等等将实现随时随地的计算。这是一个异常广阔和丰富多彩的领域,其设备极度多样化而且
20 世纪90 年代以来,得力于光通信技术的突破性进展和VoIP 技术的逐步完善,电信网和计算机网趋于统一,认同未来通信网的演进方向应是以IP 为核心的分组网络。人们综合市场需
集群系统以其结构可扩展性好,具有高效的计算性能等特性已成为并行处理发展的主流。实现系统内消息的快速传递,提高进程间通信的性能是集群式高性能计算领域的一个重要研究方向