基于GPU的LDPC存储优化并行译码结构设计

来源 :北京航空航天大学学报 | 被引量 : 0次 | 上传用户:zhangxu0202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于Nvidia公司Fermi架构图形处理单元(GPU,Graphic Pro-cessing Unit)的分层低密度奇偶校验LDPC(Low-Density Parity-Check)码译码算法的译码器结构优化设计.利用GPU架构的并行性特点,采用帧间与层内双重并行的处理方式,充分利用流多处理器硬件资源,有效缓解了分层译码算法并行度受限的问题.此外,通过采取片上constantmemory存储器压缩存储校验矩阵以及利用片外global memory存储器对译码迭代信息进行联合访问的优化方法,有效降低了访存延迟,提高了译码吞吐率.测试结果表明,通过采用多帧并行处理和存储器访问优化可以提升基于GPU的LDPC译码器吞吐率14.9~34.8倍. An optimized decoder structure design for LDPC (Low-Density Parity-Check) code decoding algorithm based on Nvidia’s Fermi GPU (Graphic Pro-cessing Unit) is proposed. Taking advantage of the parallelism of GPU architecture, the dual parallel processing between frames and layers is utilized to take full advantage of the multi-processor hardware resources, which effectively alleviates the problem of parallelism of layered decoding algorithm.In addition, by using on-chip constant memory Memory compression parity check matrix and the optimization method of united access to decoded iterative information using off-chip global memory can effectively reduce the memory access latency and improve the decoding throughput.The test results show that by using multi-frame parallel processing and Memory access optimization can improve GPU-based LDPC decoder throughput 14.9 ~ 34.8 times.
其他文献
随着国内经济市场的健全和国家开放政策的不断加大,国内市场经济政策和秩序趋于完善,佛山与其它陶瓷产区相比,已经没有明显的政策优势了,所有陶瓷产区在政策方面基本处于同一
INTOOLS软件是Intergraph(鹰图)公司开发的专业仪表自控工程设计软件,其基于公共数据库(SQL SERVER),是国际上广泛应用的具有很高知名度的工程软件.该软件既可用于仪表自控工
期刊
针对故障特征数据维数高、非线性且系统难以建立物理模型的故障诊断问题,提出了一种全局的无关线性图嵌入故障特征提取算法.通过监督学习建立原始特征的关系图,以线性图嵌入
为保证滚动阻力测试数据的精度,需对影响设备测试性能的关键因素进行评估预测.基于检测设备的测试原理,建立了轮胎滚动阻力的数值仿真模型,通过对采集的传感器输出物理量进行
中国陶瓷进入国际市场已是一种必然,与狼共舞初见端倪.作为中国最大的陶瓷生产基地的佛山,陶瓷出口一年高过一年.然而,以china(陶瓷)名扬国内外的中国,艺术陶瓷在国际上占据
本文从气动执行机构的分类、组成、常见的气路设计及原理、适用性等方面进行了详细研究,分析和总结了石油石化常用的气动执行机构及气路设计要点,为气动执行机构设计、选型、