基于Spark的极限学习机算法并行化研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:njxgfd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
极限学习机算法虽然训练速度较快,但包含了大量矩阵运算,因此其在面对大数据量时,处理效率依然缓慢。在充分研究Spark分布式数据集并行计算机制的基础上,设计了核心环节矩阵乘法的并行计算方案,并对基于Spark的极限学习机并行化算法进行了设计与实现。为方便性能比较,同时实现了基于Hadoop MapReduce的极限学习机并行化算法。实验结采表明,基于Spark的极限学习机并行化算法相比于Hadoop MapReduce版本的运行时间明显缩短,而且若处理数据量越大,Spark在效率方面的优势就越明显。
其他文献
文章论述了用于地震灾害救援中的实用声振救生仪的设计与实现方法;通过重力加速度传感器拾取被救人员发出的敲击信号,然后经过前级调理板的放大和滤波及其它处理,分为两路信号分别送到耳机监听通道和A/D通道进行转换后,再作进一步数字信号处理后,送到LCD上显示,以发现废墟中是否有生存的人员,并进一步确定人员的位置;通过实验验证,本系统已可用于实际生命探测行动。
管道泄漏监测与控制技术已经成为管道安全运行的关键问题.本文通过对泄漏信号识别、泄漏点精确定位以及管线运行数据的实时传输和科学管理等关键技术的分析,提出了基于分布式
计算机联锁控制系统作为车站关键基础信号设备,不仅要具有高度的安全性、可靠性、实时性、可维护性、可用性,强大、快速的处理能力以及良好的可扩展性,还应具有良好的性能价
网络化控制的出现,大大推动了现代控制技术的发展,正成为新的研究热点.针对网络化控制系统,提出了一种新型的延迟状态变量模型, 以此为基础设计了线行二次型最优控制器(LQR).
为了实现PLC通过其编程口与上位机进行数据传输,介绍了获得通过编程口对PLC进行读写控制的通讯格式的方法,建立了相应的通讯系统,给出了对PLC位元件和字元件进行读和写的四种
无线频谱测量接收机要求具有对宽带频谱的快速扫描功能,和对特定目标信号的实时高分辨率频谱分析能力;采用软件无线电的设计思想,通过分离的数字下变频通道分别处理扫频信号和谱
CAN现场总线是一种有效支持分布式控制和实时控制的串行通信网络;针对潜水电机工作环境复杂、故障率高、影响参数多等问题,设计了一种基于CAN总线的潜水电机分布式监控系统;通过
本文介绍了以AT89C52单片机为核心的飞机发动机智能检测控制系统,通过对转速信号的采集、运算、分析及对步进电机的驱动控制,带动仪表指针转动相应的刻度来检测速度变化,从而
为了解决作业于深海“稀软底”环境的集矿机两侧履带打滑严重的问题,以及集矿机的剪切驱动形式引起的速度调节滞后的问题,提出了一种基于模糊控制的防滑控制方法,并采用带参数自
面对控制流劫持攻击的威胁,业界使用控制流完整性保护技术来保障进程的执行安全。传统的控制流完整性验证保护机制依赖于动态二进制改写技术,在分析、实施等过程中难度较大,