若干分布式学习算法研究

来源 :中国计量大学 | 被引量 : 0次 | 上传用户:B08050402
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究一些分布式学习算法,一方面在分布式框架下对原有的一些经典算法进行了改进,另一方面对原有的分布式框架进行了改进.一些经典的算法,例如随机权网络(NNRW),它们具有快速学习和逼近能力,可以有效分析样本量较小的数据.但是,当面对高维复杂数据,或者数据储存不止在一台机器上时,这些算法计算就变得缓慢,甚至无法求解.基于此,本文针对解决大数据的分布式学习算法展开了研究和讨论,主要包括基于l1正则化随机权网络的分布式学习算法研究,基于分布式网络的非负矩阵稀疏分解算法研究和基于大规模非负矩阵的分布式学习算法研究.具体工作概括如下:1.我们提出了基于一致平均的l1正则化随机权网络分布式学习模型,旨在发挥随机权网络稀疏性和具有迭代解的优点.虽然l2正则化随机权网络具有形式解,但是面对高维复杂的数据时,它在求广义逆的过程中难以计算,并且容易导致过拟合现象.而l1正则化随机权网络在求解过程中由于l1笵数不可微,存在着迭代解.我们先把高维的数据样本分成若干份子样本数据集,对每一个子样本集,建立l1正则化随机权网络作为局部模型,并利用投影梯度方法来解,最后对得到的所有局部参数进行交互和迭代求解极限值,使得每个局部模型具有相同参数,即所提出的基于一致平均的l1-NNRW分布式算法.算法的收敛性已有证明.实验结果表明,所提出的算法在大规模的数据中具有较好性能,且解具有稀疏性,便于存储.2.针对非负矩阵稀疏分解的问题,我们提出了一种基于分布式网络的非负矩阵稀疏分解算法,试图解决一些大规模矩阵的稀疏分解问题,以及分解后的数据储存问题.其关键点在于把分布式网络的思想融合到非负矩阵稀疏分解的迭代求解上,避免之前的先求分布式网络中各个节点的参数,而后相互交换信息的同步求解.我们先把大规模的矩阵按列进行分割,然后改进已有的解决小规模矩阵分解的算法,将分布式的交互思想结合到矩阵稀疏分解的算法中,从而给出新颖的基于分布式网络的非负矩阵稀疏分解算法.我们也给出了理论上的收敛性证明.实验表明,所提出的算法对大规模非负矩阵的稀疏分解具有更好的精确度和效率.3.针对大规模非负矩阵分解的问题,我们提出了一种着色的分布式学习算法,使得原来的分布式网络具备并行计算的特性,加快计算效率.我们首先利用Welch Powell方法对已经连接好的网络进行着色,然后将大规模非负矩阵进行按列分割成小矩阵块,在相同颜色的节点上并行求解小矩阵的分解模型,最后考虑节点间局部模型的交互.实验结果表明,着色分布式学习算法对大规模非负矩阵分解具有更好的效果.
其他文献
在玉米烘干机中烘干种用带穗玉米时,正确选择和保持最适宜的温度规范,具有头等意义.如果降低空气的加热温度,则会造成干燥速度和烘干机生产率的严童下降.而空气的加热超过允
地裂缝是一种特殊的地质灾害,其活动方式主要表现为地层的垂直错动并引起地表破裂,对工程建(构)筑物危害十分严重。地裂缝活动引起其两侧地层的差异沉降会在跨越地裂缝带的地
目的研究益气养心汤联合西药治疗慢性心力衰竭(CHF)的疗效及其对患者内生化指标的影响。方法选取2016年5月至2018年5月陕西中医药大学第二附属医院收治的96例CHF患者进行前瞻
西安地铁四号线是西安市轨道交通线网中的十字骨架,是线网中的骨干线路,它穿越了14条活动的地裂缝带。为进一步研究西安地裂缝,给地铁线路沿线地裂缝的防灾减灾提供科学依据,本文
【目的】研究曼陀罗不同部位提取物对小、中型红火蚁工蚁的毒杀活性及行为作用,为利用植物源药剂防治红火蚁及其他有害生物提供科学依据。【方法】采用水试管喂养法,探究曼陀
结合会展专业特点及教学实践经验,分析设计类课程教学现状、过程考核方式,对展示设计类课程过程考核计分及构成进行改革。提出了应根据应用型人才需求调整展示设计类课程过程
语文教学不但要培养学生的阅读能力,而且要培养学生的写作才能,诵读是实现其目标的重要途径之一,因而,语文教学必须重视诵读。
目的:评价复吸预防的综合干预模式对改善吸毒者应对方式的效果。方法:设干预组和对照组。干预组实施一个月的综合干预,内容包括:讲授与讨论毒品的有关知识、成功防复吸的要素
在产品的方案论证、设计、试验、采购、生产直到交付使用,以及提供保障服务的全过程中都可能存在风险,使产品不能实现预期的目标。文中将某机载雷达天线座结构研制过程中的关
利用NCEP/NCAR再分析大气资料和中国台站观测温度资料,本文分析了1960--2015年中国夏季6—8月热浪持续天数的年际变率及其环流异常。研究发现,中国的热浪主要集中发生于东南地区