基于CUDA的R语言基本运算并行加速软件包开发、优化与应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:owenyhz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网技术的发展,信息开始呈现爆炸式增长。数据挖掘技术由于可以从海量数据中提取有价值的信息,越来越受到人们的关注。R语言作为一种解释性编程语言,因其简洁灵活的编程方式和功能强大的第三方工具包等优势,成为统计学科和数据分析领域中强有力的开源工具。然而,由于解释性语言固有的计算效率低的问题,使得R语言在面对巨大计算量的数据分析时存在处理速度瓶颈。因此,提高R代码的计算性能对于推动R在数据分析领域的应用具有重要意义。另一方面,GPU以其并行处理能力强、编程灵活、成本低等特点,在多个并行加速应用领域获得了成功。因此,在R中引入GPU并行加速计算,成为提升R代码性能的发展趋势,具有良好应用前景。本文针对GPU并行计算在R代码优化中的应用现状,研究和开发基于GPU并行加速的R工具包。在此基础上,本文亦尝试在R上移植和优化基于GPU并行计算的深度学习算法,以提高深层网络的.训练速度。本文取得的主要成果有:1.本文从R用户的使用习惯出发,设计并实现了一个基于CUDA的R计算工具包。该软件包可以支持Windows和UNIX操作系统,安装和启用时可以自动进行系统环境检测和配置,具备良好的兼容性和易用性。本文采用面向对象的编程模式搭建分层的系统架构,实现了 GPU计算函数的透明化调用和程序运行时设备(CPU/GPU)的灵活切换。这个系统具有良好的灵活性,健壮性和可扩展性。另外,本文亦在该架构基础上优化了计算中间结果在GPU上的存储和再使用问题,提高了程序的运行效率。2.本文对深度学习算法在R上的并行优化进行了探索,实现了基于CPU+GPU异构编程模式的DBN训练框架。该方法具有使用灵活、加速效果明显的优势。
其他文献
随着互联网行业的不断发展,越来越多的新兴产业加入到大数据的浪潮中,它们每天产出着海量的信息。分布式计算的出现,为处理海量数据的分析和处理提供了强有力的支持,同时也为
自人类出现以来,对于大自然的探索从来没有停下脚步。作为公众窥探和了解自然的重要窗口之一,自然纪录片以野生动植物的历史与现状、人类与自然的关系以及大自然的原始风貌为主要表现题材,表达出人类对于生态环境的深切关注,展现了人类对于社会发展与大自然两者之间关系的探索与思考,弥补了其他题材纪录片只关注人类生产活动的题材缺失。在一百多年的发展历程中,自然纪录片逐渐形成了相对完整和独立的类型体系,有着表达人文关
最近几年,煤炭市场呈现出迅猛发展的良好形势。某煤炭公司经营业绩也得以快速上升,煤炭市场的前景十分广阔,但是同时也存在很大的变数,基于此,煤炭企业倘若仍旧沿袭传统的管
3D技术的蓬勃发展使得3D视频深入人心。与戴眼镜式的3D技术相比,裸眼式3D给人们提供了更为轻松的观看体验。裸眼显示方案通常在已有的双目3D视频下生成多个中间视点,然后将生
随着信息量的爆炸式增长,人们迫切的希望提高信息的传输速率,最直接的解决办法就是提高信号的频率,时间透镜在这种情况下被提出。最开始人们研制时间透镜是为了对信号进行压
文本分类是数据挖掘领域的热点问题,但在实际应用中,会出现一些类中的文本很多,而另外一些类中的文本相对较少,不同类别数据集规模之间出现明显的倾斜情况,其中,文本分类器就
在上个世纪80年代中后期,电容层析成像(Electrical Capacitance Tomography,ECT)技术逐步发展成为过程层析成像(Process Tomography,PT)技术的一种,ECT技术具备可靠性强,成本
液压自动位置控制(Automatic Position Control,APC)系统是整个冷轧板厚控制系统的关键控制和执行部分,直接影响冷轧板带材的最终成型质量,因此研究如何提高APC系统性能就显
近年来,随着信息化时代的到来,数据呈现爆炸式的增长趋势,普通的大型计算机已经无法承担计算海量数据的任务,各大互联网公司纷纷采用大规模的Hadoop集群来完成数据的存储和分
伴随着大数据时代的来临,种类繁多的数字信息充满了人类社会的每个角落,其中文本信息占据了重要的地位。由于人工数字信息的管理已无法顺应大时代的潮流,因此,高效管理和准确