代码cache分组管理策略研究

来源 :2007年全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:yuhaolf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在动态优化系统中,为了最大程度的复用翻译的代码,用软件实现对代码cache的存储优化和代码转换的管理.代码cache存储大小不等的超级块,超级块之间可能包含指向其它超级块的链接指针,因而会带来较高的替换开销。提出采用介于粗粒度FLUSH和细粒度FIFO之间一种折中的代码cache分组管理策略,能够有效的平衡cache管理的复杂性和cache的失效率。
其他文献
针对传统蚁群算法在求解过程中搜索时间过长、易于出现早熟停滞的缺陷,受魔方变换的启发,提出了一种新颖的魔方变异策略,以加快迭代较优解局部搜索优化的速度。旅行商问题实验表明文中改进蚁群算法的收敛速度、稳定性远高于传统蚁群算法.
体绘制是科学计算可视化中极具挑战性的研究领域,光线投射体绘制算法是体绘制中最基本的算法之一。机群等高性能计算机的应用为并行体绘制算法带来了新的发展契机。本文结合机群体系结构的特点,建立了一种新的负载平衡模型并在此基础上高效地实现了光线投射并行体绘制算法。该算法首先基于屏幕图像空间块进行任务划分,然后根据新的负载平衡模型把不同任务分配给相应计算结点计算颜色值,同时收集图像结果,从而很好地掩盖了通信延
传统串行迭代算法中,收敛速度是衡量一个算法的主要依据.而并行算法要求良好的并行性。设计并行迭代算法时,并行性的增加往往导致收敛速度的降低,从而抵消了并行化带来的性能提高.本文表明需要权衡迭代算法的收敛性和并行性,以获得更好的性能。在一般线性方程组的基于分裂的迭代算法中,Gauss-Seidel算法有着良好的收敛速度但并行性很差;而Jacobi方法具有天然的并行性,但通常收敛速度较慢。我们对两种方法
本文分析了并行数据挖掘的需求及现状,提出了一种新的并行数据挖掘方式--多级并行数据挖掘。多级并行数据挖掘技术通过从不同的级别上分解数据挖掘的操作将并行数据挖掘的任务从上而下逐级细化,再通过从不同的级别上从下而上逐级融合汇总挖掘结果。实现多级并行数据挖掘时灵活地运用了HPF、MPI、OPENMP等并行编程语言的优点,进行取长补短。多级并行数据挖掘能够最大程度地提高并行数据挖掘的效率和加速度,从而更好
为完成数据重分配进行消息调度是分布式集群计算的一个重要研究内容。本文针对具有高速内部互连网络的集群之间的并行数据重分布问题,提出了一种可以更准确刻画集群内与集群间通信特点的MKPBS (Multiple k-Preemptive Bipartite Scheduling)模型,并基于这一模型设计了一种高效的启发式的消息调度算法TSMP(Triple Scheduling Message Pipel
随着半导体和通信技术的不断进展,光互连技术开始应用于计算机体系结构的互连。本文提出并论述了一种基于甚短距离光互连技术和串行包交换结构的内存服务器,可以完成多个客户端局部区域内通过光纤链路访问内存阵列,然后详细讨论了一个针对于光互连条件下的定制串行通信协议,最后给出了实际硬件系统的验证结果。
将传统微处理器与可编程器件集成在一起的混合式可重构计算系统正在成为主流计算系统。提出了一种新的混合式可重构计算系统MPRS(Multi-Pipeline Reconfigurable System),该系统中为解决流水化的应用问题而集成了多段可重构线性阵列,对其系统架构、执行模型以及系统化映射方法进行了全面论述。首先,建立了包括MPRS行为级仿真器及其编程环境在内的完整系统,给出了可重构阵列的处理
基于移动Agent的组件容器是支持灵活分布计算模型的核心实体,其拥有的知识是执行各种行为达到某种目标的关键。针对组件容器的知识表达问题,当前的一些研究工作还存在局限性。以移动Agent技术为基础,考虑到移动环境的动态性、不确定性,提出了基于规则和模式的知识表达模型,较好地解决了支持动态计算资源部署的组件容器的知识表达问题;与同类研究相比,我们的方法具有灵活、通用、高效的特点。
为了增强网格应用对网格上不同服务资源在描述、发布以及调用方式的适应能力,设计并实现了一种开放的网格服务适配器框架,该适配器框架能够屏蔽不同类型服务资源之间的差异,为其他网格应用软件提供统一的网格资源目录和动态调用接口。最后,该框架在中国国家网格系统软件的网格工作流软件中得到了验证,试验证明该适配器框架具有较好的可配置性,明显提高了网格工作流软件对不同服务资源的适应能力。
本文提出了一种高性能计算机的系统控制器,即系统控制器直接集成通信网卡并利用全局地址空间进行高性能通信。本文提出了该系统控制器的优点和面临问题,研究了该系统控制器设计的关键技术,关键技术包括集成网卡设计、两级互联结构和三套复用网络、全局地址空间和同步原语支持、内部通信协议和微体系结构等。基于以上研究利用龙芯2E处理器实现了该系统控制器,测试结果为FPGA实现下的系统控制器频率可达到80MHz,连续传