论文部分内容阅读
随着云计算、移动互联网和物联网等新一代信息技术的创新与普及,人类已经进入大数据时代,我国正在推进实施大数据国家战略。图搜索问题作为大数据应用的典型代表,已成为国际上测评面向大数据计算机能力Graph 500排名的标准测试。大数据应用与传统计算密集型应用存在显著不同,面向大数据应用特征的并行计算机系统结构研究仍处于起步阶段。本文结合国家自然基金重点项目“面向大数据的高时效并行计算机系统结构与技术”和高性能计算国家重点实验室项目“面向大数据处理的并行计算机系统关键技术”,面向图搜索大数据典型应用,针对大数据处理的并行计算机系统结构设计问题展开了系统的研究,包括并行计算机理、宏体系结构、微体系结构及并行计算机原型系统,主要工作与创新点如下:1.提出了面向图搜索的并行计算机性能量化模型(第二章)本文针对图搜索应用的数据驱动、全局同步、随机访问等特征,综合数据规模、并行度、存储访问、通信延迟等因素,采用理论分析与实验验证相结合的办法,建立了计算、访存和通信的综合量化性能模型,可为面向大数据的并行计算机系统设计提供有效指导。2.设计了面向图搜索的可扩展异构并行计算机体系结构(第三章)本文面向图搜索应用特征,设计了通用CPU结合基于FPGA流处理器的可扩展异构并行体系结构,节点内主机与流处理器通过PCIE总线连接,采用主从工作模式;节点间主机通过以太网实现控制连通,而流处理器之间则通过高速InfiniBand网络实现数据连接。设计了硬件支持全局编址的分布式共享存储访问、全局线程同步等技术,可有效缓解图搜索类大数据应用的随机访问和全局同步等问题。3.设计了面向图搜索的向量交叉多线程流处理器体系结构(第四章)本文面向图搜索应用特征,设计了面向图搜索的向量交叉多线程流处理器体系结构,提出了流处理执行机制及其指令集,建立了显式控制数据流动、捕获数据时空局部性的LRF-SRF-MEM三级存储框架,设计了基于5级流水线的向量交叉多线程流处理核,可有效加速图搜索类大数据应用的微处理器并行执行效率。4.设计实现了面向图搜索的流处理器芯片和异构并行计算机原型系统(第五章)本文基于Xilinx VC709开发板采用Verilog语言设计实现了流处理器原型,该原型拥有一个Virtex-7 XC7VX690T-2FFG1761CFPGA芯片,提供2片4GB的SODIMM内存条、8通道PCI-E接口,流处理加速器主频达200MHz;将该开发板与拥有通用微处理器芯片的主机相结合构成一个异构节点,并以此为基础构建了拥有8节点的异构并行计算机原型系统。实验结果验证了论文所提出宏、微体系结构及相关技术的有效性。