论文部分内容阅读
在高性能计算领域,数据流是一类重要的计算结构,也在很多实际场景表现出很好的性能和适用性。在数据流计算模式中,程序是以数据流图来表示的。数据流计算中一个关键的问题是如何将数据流图映射到多个执行单元上。本文通过分析传统数据流结构和当前数据流结构的指令映射方法并分析这些方法的不足,提出了基于数据流结构的新型指令映射优化方法,进行代码实现并完成实验验证。 本文首先介绍了传统的数据流结构中的指令映射方法和循环流水优化后的指令映射方法,同时基于数据流计算的结构框架,提出了多地址共享数据包的特殊结构,指出了当前指令映射的方法中还可以继续优化的部分,主要思想是通过减少片上网络中数据包的数量,减少网络拥堵,降低时钟周期数,最终通过实验进行优化算法的验证。 本文主要包括三个创新点,第一是根据数据流图的特征提出一种优化强依赖数据流子图的指令映射方法,从根本上减少多地址共享数据路由包的数量,对应设计了BINARY指令映射算法;第二是提出根据多地址共享数据包的特性对指令映射方法进行优化,延迟多地址共享数据路由包的拆分,减少网络拥堵,对应设计了BATCH指令映射算法;第三是将上述的指令映射优化方法应用到循环指令上,对应设计了CIMM指令映射算法。最后,通过实验对比,验证本文的指令映射算法优化的有效性。