分布式深度集成学习及其结构搜索算法与系统

来源 :南京大学 | 被引量 : 0次 | 上传用户:shmilyuho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,以深度神经网络为代表的深度学习算法取得了极大的成功。然而,深度学习仍存在训练样本大、计算资源要求高以及超参数调优难等问题。为此,研究人员开始探索以深度森林为代表的深度集成学习算法。然而,现有的深度森林训练算法是单机串行的,训练效率低且训练时间开销大。另一方面,现有的深度集成学习算法模型需要依赖人工构建,建模过程技术门槛较高,且费时费力。为此,需要研究自动化深度集成学习建模与结构搜索问题。然而,深度集成学习结构搜索空间庞大、模型结构复杂,这使得深度集成学习模型的自动化搜索尤为困难。针对上述问题,本文研究了基于任务并行的分布式深度森林训练算法和系统,以及基于进化算法的分布式深度集成学习结构搜索方法与通用化搜索系统。本文的主要研究工作和贡献点包括:(1)研究提出了基于任务并行的细粒度分布式深度森林训练算法,通过高效的子森林均匀拆分-合并策略以及系统层优化,实现了高效的并行化训练方法以及分布式深度森林系统。实验结果表明,该系统相比于现有深度森林训练系统gcForest可以实现平均一个数量级的加速。(2)研究实现了基于进化算法的深度集成学习结构搜索方法与通用化搜索系统。在定义和优化深度集成学习结构搜索空间的基础上,研究实现了深度集成学习结构搜索方法与通用化搜索算法框架,并实现了高效的分布式深度集成学习结构搜索系统。实验结果表明,实现方法可获得比深度森林更优的深度集成结构,并取得显著的学习预测性能提升。(3)研究探索了计算时间受限场景下深度集成学习二层复合模型。在定义和优化复合模型搜索空间的基础上,研究提出两阶段复合模型搜索方法,其中包含模型快速筛选阶段与模型选择阶段。实验结果表明,二层复合模型自动化搜索的学习预测性能总体优于Auto-sklearn,并已在某知名大型IT公司中部署使用。
其他文献
近年来,随着高分子材料在纳米技术中的应用越来越广泛,聚合物在纳米尺度下的行为渐渐受到人们的关注。当聚合物受限在纳米尺度时,其玻璃化转变、结晶、流变等许多行为都会与其本体中的行为发生偏离。在本论文中,我们首先研究了一维受限高分子薄膜的等温结晶行为,然后又将受限空间从一维扩展到二维,研究了聚合物在纳米孔道中的流动行为。首先,我们利用闪速差式扫描量热仪(Flash-DSC)研究了不同厚度的PET薄膜在较
本论文主要围绕低硅铝比有序介孔X型沸石分子筛材料、氮掺杂有序介孔碳材料以及高分散金属氧化物掺杂有序介孔碳材料展开研究。第一部分首先考察了以正硅酸四乙酯(TEOS)替代硅酸钠作为硅源,从澄清硅铝源来合成X型沸石,在此基础上使用有序介孔碳CMK-3作为模板来合成有序介孔X型沸石分子筛;第二部分以EDTA为碳氮前驱体,通过硬模板法来合成掺杂有序介孔碳材料,利用X射线衍射、低温氮气吸附脱附、扫描电镜、透射
尼龙的种类繁多,本文以最具代表性的尼龙6为主要研究对象,采用比较的方法将样品分类,来探究尼龙6及其共聚物结晶动力学性质。随着高分子表征技术发展,研究材料结晶动力学的手段越来越多,其中,Flash DSC的超快升降温速率能够防止材料在测量过程中的结构变化,保证了实验结果的可靠性。在第一章中,我们主要阐述了高分子的结晶动力学机理。由于本课题主要对尼龙材料进行表征分析,所以本章还介绍了尼龙的结构与性质,
近年来,伴随着政府层面的政策扶持和持续的资金投入,广大乡村地区的建设活动空前活跃。但值得注意的是,由于缺乏对乡村建筑的正确认识,在建设活动中,往往直接套用城市建设的经验与做法,产生了一系列的问题。为此,本文以宁镇地区的乡村建筑和南京市徐家院村的建筑更新实践为研究对象,探讨在宁镇建筑文化圈内,乡村建筑的建造体系及其更新策略,为本地区内其他乡村的建筑更新实践提供理论与实践两个层面上的参考。全文共六个章
作为商业银行中最重要的业务板块,公司业务(对公业务)承载了支持企业和实体经济发展的重任,是绝大部分商业银行收入的主要来源。近年来,伴随着利率市场化、监管驱严、金融脱媒以及互联网金融的崛起,商业银行之间的白热化、同质化的竞争越发激烈,以产品为中心的经营思路和理念早已不合时宜,商业银行的传统业务发展面临着转型压力以及巨大的挑战,尤其是公司业务。业务转型的实质是商业银行在面对复杂多变的内外部环境时而做出
应用性能管理监控平台是京东面向内部的智能运维平台,它负责对微服务架构下所有的应用进行监控和分析,从而保障系统的正常运行,使用户能够得到高质量的服务,使研发人员能随时随地通过平台看到业务、性能、组件、基础服务等多维度的监控信息,以便快速了解相关业务的运行状况并及时作出调整。京东作为电商平台,面对大促期间的流量高峰,对部分核心业务的扩容以及非核心应用的容量降级是应用性能管理平台所具备的重要功能,所以对
永续债即依照法定程序发行、附赎回(续期)选择权或无明确到期日的债券,兼具股性和债性,是种新型的混合资本工具。自2013年我国第一只永续债(武汉地铁可续期企业债)面世,直到2015年永续债发行数量、规模才开始快速增长,永续债品种也逐渐增多。与此同时,2015年供给侧结构性改革推行以来,“去杠杆”是国家的重要调控任务之一,体现在能够有效控制宏观杠杆,而微观企业去杠杆正是调控宏观杠杆的重要途径之一。在这
2018年以来,我国经济增速放缓,金融市场强调严监管,两者结合下导致债券市场的信用风险集中释放,全年债券违约规模达到1335亿元,创下历史新高,违约事件向着常态化态势发展。按行业来分,违约规模前三者分别是商贸、采掘和综合,结合行业特性,本文确定了采掘(即煤炭)行业,就其信用评级质量进行检验研究。本文首先从个体的角度检验评级质量的好坏,选取的主体为市场上首例AA+债券违约主体,也是煤炭行业违约规模最
世界语言普遍存在着羡余性特征,羡余性是语言的三大属性之一。羡余性特征是指在语言中某些词汇或者句法成分只作为语言形式存在,不表达语义。羡余现象在汉语的语音、词汇、语法等方面都存在。汉语羡余否定现象是指含有“不、没、别”等否定成分,但并不表示否定的语言现象。汉语羡余否定语法点是泰国学生学习和使用的难点。随着汉语教育事业在泰国的蓬勃发展,泰国学生的汉语学习需求逐渐延伸到更高层面。汉语羡余否定知识的学习对
随着我国网络和信息技术基础设施建设的进一步完善,移动4G网络在近年来迅速普及。以支付宝、财付通为代表的第三方支付平台快速发展。第三方支付逐渐融入到人们的日常生活中。这其中以零售支付领域的发展和变化尤为明显。但近些年第三方支付的迅速发展对银行业产生实质的影响,让银行业面临新的挑战与冲击。研究表明,第三方支付平台与商业银行都具有双边市场特征。根据双边市场理论,平台间存在一定程度的互联互通可以提高社会的