自主高端云计算服务器模型机

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户：xiao4869

【摘要】

：

云计算技术的快速发展和大量计算资源的聚集，对承载云计算应用的服务器在高密度、可靠性、稳定性、低功耗等方面提出了新的要求。为改变国外厂商占据高端云计算服务器的局面，高端云计算服务器作为应用领域中的重要信息化设备，研究和设计自主产权的国产高端云计算服务器具有重大安全战略意义。本文从服务器体系结构、多核处理器、可靠性设计(主板布局、系统散热)方面对服务器进行研究和产品模型的研制，着重探讨了可靠性设计时的

【作者】

：

CUI Ji-Shun 崔吉顺 LIU Yu-Hang 刘宇航 ZHANG Nan-Geng 张楠赓 ZHU Ming-Fa 祝明发 XIAO Li-Min 肖利民

【机构】

：

School of Computer Science and Engineering, Beihang University, Beijing 100191, China

【出处】

：

2012全国高性能计算学术年会

【发表日期】

：

2012年11期

【关键词】

：

云计算高端服务器多目标设计模型机

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

蚁群算法优化RBF神经网络的网络流量预测

传统RBF神经网络在网络流量预测过程中存在收敛速度慢、极易出现局部最优等缺点，从而导致预测精度低。本文采用蚁群算法优化RBF神经网络参数来进行网络流量预测。利用蚁群优化算法来训练RBF神经网络的基函数宽度和中心，简化网络结构，加快收敛速度，防止局部最优的出现，改善RBF神经网络的泛化能力。实验结果表明，相对于GA-RBF以及PSO-RBF流量预测模型，本文模型预测准确度更高，能够很好地描述网络流的

会议

RBF神经网络蚁群算法基函数网络流量预测

SSD内部多通道之间的写操作调度策略

本文提出了一种SSD内部多通道之间的写操作调度策略.该策略记录每个通道的数据写入量，每次数据刷新选择数据写入量最小的通道.DRAM被划分为两部分，分别作为读缓存和写缓存，写操作将数据写入写缓存后直接返回，写缓存数据量达到阈值上限后触发数据刷新操作，将部分数据写入SSD某个通道与此同时，采用读优先策略，在数据写入某个通道过程中如果收到指向该通道的读请求，则读请求抢占该通道使用权，实验结果表明，与传统

会议

固态硬盘网络存储并行访问模式动态调度

基于GPU的高性能稀疏矩阵向量乘及CG求解器优化

以有限元/有限差分等为代表的一类数值方法，总体矩阵常常具有“带状”、稀疏的特点.本文针对“带状”稀疏矩阵，提出和实现了一种高效的矩阵向量乘存储格式和算法“bDIA”.基于nVidia的GTX280系列GPU进行测试，测试数据显示：与CUSP支持的5种常见稀疏矩阵存储格式和算法相比较，所提出的bDIA格式以及相应的spMV算法可以达到单双精度浮点效率均有1倍以上的提高，并突破了该系列GPU在spMV

会议

偏微分方程数值求解带状稀疏矩阵向量乘CG求解器图像处理器

基于OpenCL的均值平移算法在多个众核平台的性能优化研究

OpenCL作为一种面向多种平台、通用目的的编程标准，已经对许多应用程序进行了加速.由于平台硬件和软件环境的差异，通用的优化方法不一定在所有平台都有很好的加速.本文通过对均值平移算法在GPU和APU平台的优化，探讨了不同平台各种优化方法的贡献力，一方面研究各个平台的计算特性，一方面体会不同优化方法的优劣，在优劣的相互转化中，寻求最优的解决方案.实验表明，优化后的算法在AMD GPU平台、NVIDI

会议

图形处理器众核平台性能优化均值平移算法

一种基于访存位置的多核DSP分簇算法

本文提出了一种基于访存位置对指令进行分簇的算法，可以显著提高FFT 等计算密集型程序的性能.通过分析基本块中每一条load 或store 指令中访问内存的基址和偏移量，能够获得任意两条访存指令之间的关系.然后经过数据流分析，对基本块分别进行一次正向扫描和逆向扫描，将基本块中的每一条指令的操作数绑定到一个运算簇上.实验结果显示，本文中的算法相比已有的传统分簇算法可以获得13.57 倍的性能提升.

会议

数字信号处理器分簇算法访存地址分析编译技术指令级并行

三维图形渲染引擎的线程级并行及优化

在OGRE 3D的场景管理器模块下增加渲染队列副本,采用基于Boost线程库的相关信号量和函数构建OGRE 3D多线程模型,建立前后台读写缓冲并形成流水机制,实现OGRE 3D在多核平台下的并行加速。测试结果表明,OGRE 3D渲染速率达到原来的2-3倍,有效提升了OGRE 3D的场景渲染性能和CPU剩用率。

会议

三维图形渲染引擎多线程技术场景管理器

基于GPU的生物序列比对工具比较与评价

生物序列比对是生物信息学研究中最基本的研究方法。随着生物序列数据的快速增长,大批量序列比对变得极为耗时。针对这个问题,许多已有的高性能计算技术开始用于加速序列比对过程,GPU计算就是其中之一。已有的基于GPU的生物序列比对工具过分强调速度提升,但是缺少对准确度,性能功耗比,性价比和编程复杂度等方面的考虑。本文通过文献分析的方法。从以上四个角度详细地比较了这些基于GPU的生物序列比对工具,并进一步分

会议

生物信息学序列比对性能功耗比图像处理器

一个结构网格并行CFD程序的单机性能优化

从单机性能优化角度对一个高阶精度结构网格CFD并行程序进行了优化.通过识别关键变量并对其进行常量参数化优化，使编译器能够实现更高级别的针对性优化；根据程序数据结构特点及访问模式，设计了分级数据缓存技术，使程序主要计算代码能够以更优的方式访问主要数据结构，提高访存空间局部性；进行了各种循环变换以优化访存性能.在国家超算长沙中心“Tianhe-1A”并行机上的测试结果表明，相对于采用Intel编译器最

会议

计算流体动力学并行计算性能优化变量参数化分级数据缓存技术

MapReduce本地优先作业调度策略研究与实现

现在MapReduce并行计算模型在不同场景下得到了广泛使用。由于网络IO传输速度通常远小于磁盘读取速度,所以Map任务的本地执行可以提高系统的吞吐率,减少作业执行时间。但是在多作业情况下,由于作业数据分布的随机性,Map任务的本地执行可能会产生负载不均衡的问题。本文提出了一种基于本地优先的作业调度策略,实现Map任务的完全本地化的同时通过优化作业调度,最大限度地实现了节点间的负载均衡。

会议

并行计算模型作业调度负载均衡仿真实验

Hadoop平台数据访问监控机制研究

本文针对Hadoop平台数据本地化处理的新特征，探索Haoop平台中Map任务数据访问监控机制。提出Hadoop平台数据访问监控机制不仅应服务于数据请求响应时间或吞吐率等传统数据访问效率优化目标，还应服务于保障并行执行的多Map任务数据访问开销均衡度。针对新的服务目标，本文提出包含物理数据块层、逻辑文件块层和文件层的层次化数据访问监控信息视图模型：依托Hadoop平台现有结构，设计了基于maste

会议

开源数据处理平台数据访问监控体系功能模块

自主高端云计算服务器模型机

与本文相关的学术论文