基于马氏抽样的支持向量机分布集成学习的泛化性能

来源 :湖北大学 | 被引量 : 0次 | 上传用户:historycode
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分治策略是处理大数据的基本策略,尤其是近年来在分布式有很大发展的情况下,分治策略显得尤为重要.但是大数据中冗余或噪声样本不仅会消耗存储空间,还会影响机器学习算法的计算效率和精度.因此,在大数据环境下样本选取或重抽样方法的需求更加迫切.本文以支持向量机作为突破口,对基于马氏抽样的支持向量机分布、集成学习等进行了系统研究.具体的研究工作概括如下:1.研究了基于一致遍历马氏链样本的支持向量机集成学习的泛化性能,建立了最优的学习速率.在理论研究的基础上,我们提出了两个基于马氏重抽样的支持向量机集成学习算法.公共数据集上的数值研究表明,相对于经典的集成算法而言,本文提出的两个基于马氏重抽样的支持向量机集成学习算法具有更小的错分率、更少的抽样和训练总时间.2.建立了基于一致遍历马氏链样本的支持向量机分布式学习的泛化界,并得到了最优的收敛速率.本文提出了一种基于马氏抽样的支持向量机分布式学习算法.公共数据集的数值研究表明,相对于经典的支持向量机分布式学习算法而言,我们提出的基于马氏抽样的支持向量机分布式学习算法具有更高的精度,更少的抽样和训练总时间.3.针对大数据环境下支持向量机的正则化超参数调优非常耗时等问题,本文提出了非正则化超参数调优的支持向量机算法.公共数据集上的数值研究表明,相对于经典正则化超参数调优的支持向量机算法而言,我们提出的非正则化超参数调优的支持向量机算法具有更高的精度,更少的抽样和训练总时间.作为应用,我们还研究了非正则化超参数调优的支持向量机分布式学习的泛化性能.
其他文献
学位
学位
学位
学位
机器学习的基本问题是利用模型对数据进行拟合,其目标是追求泛化能力.虽然深度学习被认为是机器学习发展史上的第二次浪潮,但深度学习一般需要大规模的训练数据,而实际应用中往往会遇到训练数据的规模相对较小的情形,这时采用支持向量机等浅层机器学习方法就可以很好地解决或处理.本文以支持向量机为突破口,对大数据环境下拉格朗日支持向量机、基于支持向量机的增量学习以及基于hinge损失的在线成对学习等进行了研究.主
学位
习近平总书记提出"北京实施新版城市总体规划,突出政治中心、突出人民群众是最重要的两条要求"。围绕习总书记的指示精神,北京按照"一核一主一副,两轴多点一区"城市空间结构,将首都核心功能区、城市副中心、中心城区和新城区的控制性详细规划于街区层面分类编制控制性详细规划(简称"控规")在规划理念、组织方式、实施机制等方面进行探索创新,
期刊
学位
党的十八大以来,习近平总书记不仅反复强调文化自信,而且将文化自信与道路自信、理论自信、制度自信并提,并用更基础、更广泛、更深厚、更基本、更深沉、更持久这六个层层递进的词语来形容文化自信,表明党中央高度重视文化自信,也充分说明文化自信的必要性和紧迫性。文化自信的提出基于当代中国发展的现实需要。改革开放四十多年,社会主义市场经济蓬勃发展,我国经济总量稳居世界第二位,为中华民族伟大复兴奠定了坚实的物质基
学位