帮软件找寻内存墙之门(第二部分)——以并行性换性能

来源 :第二届工程建设计算机应用创新论坛 | 被引量 : 0次 | 上传用户:squarestone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通常认为只有串行程序需要改动以便在多核系统上并行执行。然而,许多现存的并行算法在多核系统上并行执行得也很糟糕,因为它们只是针对错误的设计参数进行了优化。过去我们一直在努力探索最可能并行的算法,并同时尽量减少线程之间的通讯。然而,对多核而言,线程之间的通讯开销相对便宜,因为通讯的数据驻留在被线程共享的缓存中。同时,多核能够支持的并行线程总数受限于核数乘以每个核上运行的线程数。因而,第三个参数:内存的使用率,对并行的多核应用变得越来越重要。在这个系列论文的第二部分,我们对高度并行的最先进的算法与适度并行算法的行为进行对比。在适度并行算法中,部分并行算法被对内存带宽需求较低的算法所替代。我们揭示出,在当前的多核上,后者的性能是高度并行算法的三倍。这里总结了所采用的一些技术和一些性能指标。关于本文所讨论的算法的详细描述,我与我的同事和乌普萨拉大学的学生一起曾在ICS2006会议上展示过。
其他文献
传统机房装修花费巨大,空调效率不高。传统机房的服务器安装密度无法满足日益增长的应用、业务需求。某些领域如石油地质勘探、海洋环境调查、极地科考、战地预警、战地通讯
会议
计算机辅助设计使得设计人员从手工劳作转向计算机辅助设计,是巨大的技术进步,但是传统的二维计算机设计技术在整个社会发展中越来越暴露出其严重的不足,甚至制约了整个行业
走进位于长兴的中国扬子鳄村葡萄基地,能够看到在白色的钢架大棚下,成片的葡萄地一眼望不到边际,一串串成熟的葡萄让人垂涎欲滴。往前,一条800米长的葡萄长廊横贯了整个葡萄
本文通过对流液洞的分析,指出了常用的流液洞的结构和作用。重点介绍了二次流液洞结构的作用和目的,并结合实际应用,分析二次流液洞结构的效果。
多核时代来临了,许多新的文章和软件产品正专注于应用软件并行化的需求。本文将探讨三种常见的误解:(1)密集并行(译者注)执行将始终受益于多核技术:(2)内存墙是只与硬件有关的
会议
随着CPU性能(4核、8核、多核)、网络设备带宽(万兆网、QDR InfiniBand)、存储接口(4Gb、8Gb)性能越来越高,对存储设备的性能要求越来越高。受经费、场地、部署时间等的限制,
三维渲染模型的数据结构记录了几何、贴图和光照信息等,多用于动画、建筑静帧表现:但对于实时计算的仿真系统,需要记录通过物理引擎驱动的物理属性。因此产生了多维数据模型。
针对小区规划初期阶段日照分析所需要解决的最大容积问题,提出了标准遗传算法计算拟建筑区域最大容积率的方法,通过将各个时间段进行编码,将拟建建筑物对应的部分削去计算建
根据中国传统建筑的各种规律整理成数据库,用程序调用不同的数据库生成不同建筑模型,进而生成施工图和材料统计。将该技术广泛应用于仿古建筑设计和文物建筑数字化。
近年来,随着电子信息技术的高速发展,各行各业都进行了数字化、信息化的改革大变身,相应的数字信息技术在自身发展与前进的过程中,应用的领域也扩大到了各行各业。比如被誉为
会议