论文部分内容阅读
高速缓存一致性问题不仅关系着系统的正确性,还对系统的性能有着重要影响。多核处理器的高速缓存一致性协议设计更为复杂和验证更加困难。使用多核处理器构建大规模并行计算系统已经成为主流。在此环境下,高速缓存一致性协议需要处理的一致性事务更多,涉及到处理器芯片内多个高速缓存之间、处理器芯片内高速缓存与片外高速缓存之间、处理器芯片之间的一致性问题等。所以研究多核处理器的高速缓存一致性问题具有重要的学术意义和应用背景。首先,本文对多核处理器中的高速缓存一致性协议进行了研究,重点研究了扩放性较好、能适应多核处理器本身特点的MOESI协议及其实现,并对该协议做出了优化;其次,本文研究了在由多核处理器构建的并行计算系统环境下的高速缓存一致性协议,实验证明本文工作能够有效减少片内高速缓存失效次数(13%到30%)和提高系统性能(运行时间最多能减少30%左右);最后,本文研究了片上高速缓存的包含与非包含策略,提出了一个基于不包含策略的片上高速缓存系统设计,从而提高了片上高速缓存容量的利用率和提升了多核处理器的性能。高性能计算机是一个国家的重要战略资源,其国产化水平是一个国家综合国力的集中体现。目前采用我国具有完全自主知识产权的龙芯多核处理器构建高性能计算机已经被一些研究单位或机构纳入日程。首先,本文特别针对科学计算领域应用,对龙芯体系结构的多核处理器的片上缓存系统的性能进行了评测,指出了龙芯多核处理器在科学计算领域中的一些性能特点。其次,依此进行了一些设计空间上的探索。实验证明,在某些情况下可以使片上二级高速缓存命中率提高50%以上,等。高性能计算机的网络,对于机器的整体性能具有至关重要的作用。首先,本文研究了一种先进的新型网络拓朴结构:MPU,研究内容包括其数学模型、网络拓扑、路由算法等。其次,本文从理论上对MPU与当前其他先进高性能计算机网络进行了对比分析。最后,本文还介绍了为MPU所开发的一个大型并行模拟器MPUS的原理、架构、工作流程,等。实验证明,MPU的设计正确,且具有良好的可扩放性。KD-50-Ⅰ万亿次计算机是首台基于龙芯通用高性能处理器的国产万亿次计算机。首先,本文围绕KD-50-Ⅰ的体系结构设计,研究实现了KD-50-Ⅰ的无盘启动技术、构建了KD-50-Ⅰ的高效操作系统和文件系统、优化了KD-50-Ⅰ通信库,从而提高了系统的性能和可用性,有利于KD-50-Ⅰ的推广应用。其次,本文研究了实际物理学研究中常用到的扫描电子显微成像模拟程序在KD-50-Ⅰ上的应用,并对其进行了优化。本项工作提高了应用程序运行效率,为KD-50-Ⅰ在不同领域的应用提供了示例。