论文部分内容阅读
由于集成电路芯片设计与生产极限的逼近,综合考量相应的能耗与成本,使得近年来硬件的计算架构向着多核与众核处理器的方向发展。为充分利用现代计算架构的计算资源,算法需针对多核和众核处理器进行专门的并行设计。本论文依托自然科学基金超级计算科学应用研究专项的资助,针对天河二号超级计算机的硬件架构,将最小权重编码与栈式自动编码器两种算法进行了并行化设计与实现。实现最小权重编码算法的并行加速。LDPC码作为各种先进通信系统的信道编码标准,通常用于修复信号在传输过程中发生的错误。确定LDPC码最小码重的数量有利于设计更好的LDPC码的结构。而在计算某类LDPC码的最小权重码的数量时,其运算量随其码长呈指数增加。本论文将最小权重编码算法构造为一个多叉树搜索与剪枝的问题,实现了任意码长LDPC码的最小权重编码统计。在具体实现方式上,我们使用不同计算核心对每个子树进行并行搜索。最终选用MIC与CPU协同计算模式在天河二号上并行计算得出最终结果。实现栈式自动编码器算法的并行加速。深入研究视觉显著性计算模型有助于深化我们对人类视觉系统的理解。但是随着大规模图像数据库的出现,用于显著性估计的栈式自动编码器算法在处理海量图像的耗时大大增加。深度学习开源库是一个实现该类算法并行化的可行方案。本文分析了深度学习开源库Xeon-CafPhi、DL4J、TensorFlow以及MXNet在算法实现上的优缺点,分别选用Tensor Flow和MXNet实现该算法的并行加速。经本地测试,TensorFlow实现的系统运算速度是原有Matlab实现的两倍以上。同时,在天河二号上的测试表明,MXNet实现的系统在各性能指标上均取得了良好的结果。本论文通过对最小权重编码和栈式自动编码器两种算法的并行实现,一定程度上加快了LDPC码性质研究与视觉显著性研究的工作进展,丰富了天河二号计算机上的科学计算应用。