基于忆阻器的低通信图遍历系统

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:yishu888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图遍历算法是一类典型的I/O密集型应用。在传统计算系统中,图遍历算法存在着大量的随机访存和数据移动。此外在多加速器图计算系统中,数据分布不均衡,计算单元间通信无序随机、无法预测,这些都给计算系统带来了巨大的通信开销。忆阻器ReRAM是一种新型非易失性存储器(Non-Volatile Memory,NVM),具有存储密度高、非易失性等特点,ReRAM crossbar结构能提供高效的访存。PIM(Process-InMemory)技术将计算单元放入存储单元,以提供更大的内存容量和带宽,为解决图遍历中数据移动和带宽紧张等问题提供了方向。但多加速器间无序随机的通信问题还有待进一步解决。新提出的ReGra系统是一个基于ReRAM crossbar组成的图遍历处理系统。ReGra利用PIM技术提供大内存容量和大带宽,并解决了通信开销大的问题。首先,根据图遍历算法的访存特点和ReRAM crossbar一次能够读取整行数据的特点,采用基于压缩稀疏行的紧凑连续数据存储形式。接着,提出了一个区间数据块哈希均衡图划分算法(Interval Block Hash Balance),以较低开销将图数据划分到多个处理单元(cube)内,有效降低了系统整体通信时间。针对多个cube间的大量无序随机通信,首先依据数据分布区间将通信消息聚合压缩,以减少消息数量。再者,利用循环回合式通信(Circular Round Communication)机制,在一个时间集中且方向明确的时段内进行通信。该机制有效减少了无序随机消息带来的通信和处理开销。此外,ReGra系统引入了多种缓存,既提升了数据局部性,又降低了对ReRAM crossbar的访存频率,提升了计算效率。利用z Sim和NVMain工具构建了ReGra系统仿真环境,并使用真实图数据对宽度优先算法和单源最短路径算法进行了测试。实验结果表明ReGra系统能显著提升图遍历计算的性能,且在通信开销方面显著降低。此外整个系统能耗开销明显降低。
其他文献
美育也叫作美感教育或者审美教育,是指培养学生认识美、欣赏美和创造美的能力的教育,是人的全面发展教育不可缺少的组成部分。通过对小学音乐教师课堂教学的观察和分析,发现多数教师的教学都还只是停留在音乐技能的教学层面,而忽视了学生美感经验的生成和对音乐当中美的要素的欣赏。体验是一种生命体验,是每一个个体基于自身的亲身经历,并在此过程中有一些领悟和体会。在体验的过程中,既包括认知、情感和想象力等多种认知因素
Landsat 8卫星上携带的两个主要载荷,OLI和TIRS,相比前期的Landsat系列卫星数据,在波段设置和空间分辨率设计方面有了明显的改进,因而得到了更加广泛的应用。但云和云阴影的存在严重制约了该数据的使用。云和云阴影降低了地表变化检测的精度及遥感影像定量参数提取的精度。有效的识别云和云阴影对Landsat 8卫星数据的应用至关重要。为提高Landsat 8卫星数据云检测的精度,前人开发了
随着社会的发展,人们的健康锻炼意识愈发强烈,参与健身锻炼的人群也日益增多。在国务院发布“互联网+”行动计划的背景下,本文以基于互联网+健身房运营模式下的训练课程设置为研究内容,剖析原有健身房运营模式下的训练课程设置所出现的问题,并提出改进建议。本文运用文献资料法、专家访谈法、个案分析法、数理统计法、问卷调查法等研究方法,以乌鲁木齐市Liking Fit健身房的训练课程设置为调查对象进行分析研究。研
和平历来是人类的美好愿望,也是国际政治所追求的目标,但是和平并不具有先验性,在人类的历史长河中,战争总是会打破人们宁静的生活。1648年三十年战争结束,威斯特伐利亚体系在欧洲确立,但是战争依旧未能退出历史舞台,在此后的数百年里战争频频发生,特别是在人类社会发展到二十世纪,两次世界大战先后在人类历史上留下了难以抹去的记忆。战争之后,最重要的就是构建一个和平的环境,交战国双方缔结和平条约是两国在战争结
随着航空航天器应用的不断拓展,时不变假设越来越难以满足实际工程结构的分析与设计要求,考虑工程结构的时变特性变得越来越重要。另外,主要基于压电式加速度传感器的传统的结构动力学测量手段也越来越难以满足航天器结构实时健康监测和模态参数在线辨识的需求。光纤布拉格光栅传感器相对于传统加速度传感器具有体积小、质量轻、可复用、不易受电磁干扰等特点,使其能够很好地适应航天器结构的在线测量和监测。本文研究了基于光纤
卡口图像车辆检索一直是智能交通领域研究的重要课题,随着图像处理和模式识别技术的不断发展,基于深度学习的车辆图像检索方法已经成为研究热点。车辆检索一般是指先从卡口拍摄的车辆图像中将目标车辆图像块检测出来,再对其进行相对应的车辆图像检索工作。本文对图像中的车辆检测车辆检索算法分别做了研究,主要针对卡口车辆图像检测和卡口图像车辆检索这两方面的准确率进行了改进,具体的研究工作如下:(1)描述了当前卡口车辆
认知无线电和雷达电子战的发展对提升复杂电磁环境中调制信号的识别能力提出了重要需求。在复杂频谱电磁环境下,只有充分感知和分析敌方电磁频谱资源的使用情况,才能有针对性地削弱非合作方雷达设备的使用效能,从而在电子战中处于制高点。但是,随着复杂体制雷达的出现,现有的调制识别技术已经不能广泛的适用于不同调制类型的信号识别框架。论文针对复杂电磁环境下雷达信号调制识别系统,围绕时频分析、图像融合和深度学习理论,
二次函数是初中数学的一个重要知识点,如果学不好二次函数,高中的数学学习也会受到影响。大部分学生对其学习效果并不理想,导致得分率屡屡较低。这就表明初中学生在二次函数学习板块存在较大的问题,若想获得高分突破难点,应找出学习过程中造成困难的实际原因。本文以西宁市第二中学九年级普通班与实验班为样本进行研究设计,明确此次研究的理论基础以及具体的研究方法,指明研究目的。同时对两个班级学习二次函数的现状进行问卷
非晶合金是采用快速冷凝技术得到的金属材料,不具有晶体金属长程有序的原子结构,在室温下表现出优异的物理和化学性能,具有广泛的应用前景。由于其硬度高、导热性差、宏观脆性等特点,在机械加工中表现为典型的难加工材料。学者虽然对非晶合金的机械加工做了许多研究,但非晶合金的加工技术仍然处于发展阶段。了解非晶合金切削时的材料变形特点和切屑形成过程对实际加工具有重要的指导意义。本文对非晶合金切削过程中切削力变化规
实用文体翻译的作用非常显著,不仅表现在人们的日常生活交际中,也表现在政治、经济、文化等各个领域中。尤其是随着中国文化影响力的不断增强,中国传统历史、文化领域的翻译