【摘 要】
:
魂芯DSP处理器是一款32 bit静态超标量、分簇结构的、支持SIMD的VLIW处理器。魂芯DSP芯片有4个执行簇和3个内存块,但簇间数据传输和寻址会占用总线带宽。魂芯DSP上每个簇中有
【机 构】
:
中国科学技术大学计算机科学与技术学院,中国科学技术大学安徽省高性能计算重点实验室
论文部分内容阅读
魂芯DSP处理器是一款32 bit静态超标量、分簇结构的、支持SIMD的VLIW处理器。魂芯DSP芯片有4个执行簇和3个内存块,但簇间数据传输和寻址会占用总线带宽。魂芯DSP上每个簇中有大量的计算部件,但是现有的编译器框架中指令调度算法是针对非分簇结构的,无法充分利用魂芯DSP的分簇结构特点,产生出高效的指令级并行代码。根据魂芯处理器架构分簇的特点,提出了在魂芯DSP上进行指令分簇和指令调度的启发式算法,并且在开源Open64编译器框架上进行了实现。实验结果表明,该算法在魂芯DSP编译器上的实现可以显著提
其他文献
在无样本类别先验信息下,样本间的局部结构和全局结构信息在降维过程中成为重要的考虑因素。多数降维方法只考虑样本间的单一结构。在降维过程中考虑混合结构,提出基于L 2,p
随着大中型城市轨道交通系统的大力普及和逐渐完善,有关地铁车辆门控器单元的功能测试、故障检测和维修保障技术也成为研究的热点。以北京博得公司生产的地铁车辆门控器单元
随着智能门锁的普及,传统插卡取电的方式已不再适用,利用室内人体感应设备判断房间是否有人存在为市场所需,但目前已有的感应器在精确度、适应性等方面存在不足,尤其不能实现
基于云计算技术的传统人工智能存在着高时延与低安全性问题,而这些问题推动着边缘人工智能逐渐走进大众的视野。但边缘人工智能也存在着嵌入式处理器计算能力弱、效率低下等问题。利用Xilinx公司出品的Zynq系列可拓展处理平台进行软硬件协同设计,实现了一套嵌入式视频采集与实时图像边缘检测系统。利用Vivado HLS工具设计并实现了本系统中的硬件图像边缘检测IP核,并使用Qt工具为本系统设计了可视化的操作
为了有效提高轨道交通车辆门的运行性能,在分析传统方波脉宽调制(PWM)在控制电机时转矩脉动、效率低等缺点的基础上,介绍了空间矢量脉宽调制(SVPWM)的控制理论与原理,并选用
作为网络数据交换和数据共享的标准,XML数据越来越多地用于表示应用系统的流数据。然而,受制于流数据处理有限空间开销等特征,如何高效地实现这种查询成为值得探讨的问题。与