基于FPGA的软硬件协同图计算加速系统

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:margaret9163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图结构具有高效的表达能力,广泛应用于各类计算领域,诸如社交网络分析,网络搜索等。随着图数据规模指数级爆炸增长,高效性成为图数据处理十分重要的要求。然而,图计算在现有通用处理器架构上存在着严重的不规则访存问题,其处理性能因而受到很大影响,研究面向图计算的硬件加速器成为性能加速的重要途径。现有的图计算加速器通常采用以点为中心的编程模型来充分利用节点间的并行性,在运行过程中使用位图结构维护活跃点集合,从而保证算法的正确执行。然而,基于位图的存储模式需要记录所有节点的执行状态,通常仅在活跃点较多时才具有较好的存储效率,活跃点较少时则会引入大量的无效计算开销,极端情况下,这一性能损失可达40%以上。如何较好地根据图计算活跃量自适应定制图计算硬件结构成为亟待解决的问题。基于FPGA的软硬件协同图计算加速系统通过检测运行时活跃点数量,动态地选择合适的存储模型,同时采用点数据缓存,边数据预取等优化方法提升访存效率,从而提升整体图计算加速系统的性能。具体地,在软件上提出了基于位图和队列混合存储结构的Push-Pull编程模型,允许在图计算过程中选择合适的活跃点存储结构;在硬件上则设计了基于层次存储的加速器架构来保证两类数据的高效管理。系统采用FPGA片上资源来实现计算单元之间的连接,消除了计算流水线的时间损耗。在处理大计算量图迭代的功能模块中,系统采用了点数据访存优化设计,降低图计算中的点数据的随机访问开销。此外,设计了片上点边流水线同步结构来支持边数据预取,将随机边数据访问转化为顺序边数据访问。实验结果表明,相较于现有的FPGA图计算系统Fore Graph,本系统实现了1.36~3.02倍的性能提升,并且系统片上资源开销更低。同时,系统针对大规模计算设计的访存优化和缓存传输策略极大程度上保证了系统性能。
其他文献
正电子发射断层成像(Positron Emission Tomography,PET)是一种非侵入式的核医学分子影像技术,被认为是核医学领域中生化灵敏度最高的医学影像技术。小动物PET对脑部活动具有极高的生化灵敏度,是研究病理机制、开发诊疗方法的尖端科学仪器。传统小动物PET等成像手段均要求成像目标在成像视野中保持静止以获取无运动伪影的图像,成像目标通常处于非清醒或非自由状态,观测结果不能反映其脑
在现代制造系统中,高速、高精度的数控加工促进了多项式样条插补的研究。多项式样条曲线已经广泛用于数控加工轨迹平滑。无论是小线段拐角处的局部平滑,还是全局的刀位点轨迹平滑,都使用了具有各种特点的样条。但是由于多项式样条曲线弧长与参数之间的非线性关系,样条实时插值会存在进给速度波动问题。已有的样条实时插值算法中:(1)近似弧长参数化会改变原有的刀具轨迹;(2)泰勒展开法的阶次难以确定;(3)迭代法的计算
鄂西南地区,又称“鄂西”,位于湖北省西南部,武陵山北部,雨热同期,降水充沛。吊脚楼作为鄂西南地区传统民居最主要的建造形式,不仅具有鲜明的民族文化属性,同时也有典型的生态适应性特征。本文以鄂西南地区吊脚楼为研究对象,以其主体结构的形态为切入点,以文献阅读、实地调研、工匠访谈和建筑测绘等方式开展调研,从调研结果中提取吊脚楼的主体结构和构件设计的数理特征,定量化地剖析吊脚楼主体结构设计的动态数据关联规律
近几年来,生成对抗网络模型(Generative adversarial networks,GAN)作为深度计算任务中表现出色的生成式模型,是人工智能领域最重要的研究途径之一,尤其是在计算机视觉领域,GAN在诸多挑战中取得了巨大进展。但是在大数据时代下,由于数据结构之间的关联性增强,GAN对数据的表现能力有限,而张量可以对数据进行有效表示并保留数据之间的关联关系,如何将两者结合使GAN的生成效果更
城市是全球减缓气候变化和实现可持续发展目标的前锋。然而,不断增加的城市生活垃圾产量和相对滞后的垃圾处理技术,使得中国的城市面临着垃圾围城和气候变化的双重压力。科学评估我国城市生活垃圾的资源利用潜力及其温室气体排放对制定我国城市低碳和能源政策具有重要意义。现有我国城市生活垃圾资源潜力和温室气体排放的研究存在着核算精度较低和时效性不强等问题,影响了评估结果的准确性;且城市生活垃圾温室气体排放的驱动因素
焊接自动化技术在信息化技术迅速发展的今天进步迅速,焊接任务也开始趋于复杂化,单体作业已经不能满足当前工作任务的需求,应当加强对弧焊机器人和变位机的协调运动研究,通过协调运动来提升机器人的焊接效果。文章利用机构运动学分析方法对焊接机器人和变位机进行运动分解,从离线编程的角度进行分析,提出相关措施以期实现弧焊机器人和变位机的协调运动。
期刊
由于水资源相关的污染和短缺问题,开发高效、绿色和可持续的清洁水生产技术具有重要意义。近年来,界面太阳能蒸发技术因其较高的水蒸发效率倍受关注。然而,由于水生环境的污染,用于光热水蒸发的水源中潜在的挥发性有机污染物和病菌等难以去除,限制了该技术的实际应用,这一点很少得到关注。针对上述问题,本文提出了光催化降解协同光热水蒸发净化技术,设计了适用于光催化降解协同光热水蒸发净化的MIL-53(Fe)基复合光
目的:(1)建立小鼠肝微粒体孵育体系中羧酸酯酶(Carboxylesterase,CESs)代谢产物氯吡格雷羧酸衍生物(Clopidogrel carboxylate,CCAM)和7-乙基-10-羟基喜树碱(7-ethyl-10-hydroxycamptothecin,SN-38)的液相色谱串联质谱(Liquid chromatography tandem mass spectrometry,LC
住宅与办公室内是人们最常处于的环境,室内气氛时刻关乎着人体健康。《国家室内空气质量标准》明确规定了甲醛,苯等挥发性有机化合物(VOCs)在室内的浓度规范。除有毒污染物外,过高的二氧化碳浓度也会使人精神萎靡。然而,现有的室内气体环境检测技术较为有限,且费用高,设备庞大,难以实现实时监控。气体传感器拥有响应快,灵敏度高,功耗小等优点,然而面对官能团比较接近的VOCs,气体传感器很难做到准确识别。面对传
艉滑道式收放技术是无人艇布放与回收的一种主要方式,无人艇在靠近母船尾部回收装置的过程中会受到母船尾流的干扰,产生偏航力与力矩,给无人艇的操控带来困难,这种运动干扰过程是典型的多尺度多体动力学问题。论文以62系列滑行艇4667-1模型为无人艇,5512-MS模型为母船,基于HUST-SHIP软件,采用多移动域动态重叠网格方法对静水中无人艇靠近母船尾部捕捉装置过程中的船艇干扰特性进行了研究。主要工作如