【摘 要】
:
近年来,统计分类在机器学习中引起了广泛关注。对于分类问题,机器学习算法的性能极大地取决于不同模型的特征。一种可能的解决方案是我们可以使用集成学习来整合各种学习算法
论文部分内容阅读
近年来,统计分类在机器学习中引起了广泛关注。对于分类问题,机器学习算法的性能极大地取决于不同模型的特征。一种可能的解决方案是我们可以使用集成学习来整合各种学习算法的组合。在集成学习的过程中,能够采用各个分类器来提供有关未知示例的附加信息。众所周知,从准确性和泛化的角度来看,这种解决方案可用于改进整体分类。而对于集成学习而言,难点在于如何组合“好而不同”的学习器以及超参数的设置变得至关重要。本课题想解决集成学习选取学习器和超参数的问题,我们提出了一种新的自适应调参的stacking集成学习算法(Self-adaptive stacking ensemble model简称SSEM)。首先利用Stacking结合神经网络模型构建的机制,根据参数的相关关系、模型的多样性评估方法(Q统计方法)来构建了混合集成模型。其次,构建了模型组合最优和参数组合最优两个模型来完善混合集成模型,利用遗传算法的全局搜索能力来对两个模型寻优,把准确率设置为适应度函数,经过父选择、交叉、变异等代数繁殖,且达到繁殖固定代数后停止,最后得到最优模型组合和超参数的设置。与其他集成学习算法不同的是,SSEM算法能够自适应的针对不同的数据集选取最优的模型组合和参数设置。为了验证SSEM的性能和适用性,本课题将其应用在8个不同领域(情感分类、图像分类、人脸识别分类、文本分类、金融数据分类、社会分类、计算机分类、生活分类),用9个数据集通过与7个先进的分类器(朴素贝叶斯、极端随机树、Logistic、随机森林、CART决策树、Adaboost和Bagging)在四个不同的评价指标(准确性、召回、F1评分和马修斯相关系数)下进行比较,可以得到在8个数据集上与对比的7个分类器而言SSEM表现优异,在Fudan set数据集上,该算法的结果和极端随机树、CART决策树一样,但SSEM模型自适应选择的模型分类器为CART决策树,进一步证明本课题所提出的算法能自适应的选取最优的模型组合和参数设置。不可否认,本课题现在的工作仅仅只是这个主题的开端,在未来中,更高层次的分类器将会出现,模型层中基分类器的权重也会被考虑,例如,使用深度自适应参数集成学习来集合更多层并为每个分类器分配权重。
其他文献
随着电力电子技术和控制理论的发展,交流电机控制策略应用范围越来越广。而永磁电机也随着永磁材料的不断发展而被广泛应用于各种工业领域,如机器人和数控机床等。其中交流电
热激蛋白(Heat shock protein)是一种广泛存在于原核和真核生物体中的一类在遗传上具有高度保守性的特殊蛋白,在胁迫条件下能够大量应激表达。热激蛋白在生物体中具有分子伴
《喧哗与骚动》是威廉·福克纳的杰作之一,描述了一个经典的约克纳帕塔法世系家族的故事,即康普森一家逐渐衰落的故事。小说以其高超的写作技巧,深刻的意蕴表达和生动的人物刻画受到文学批评家们的极四关注。在福克纳的作品面世初期,他笔下的女性或失常或放荡,通常都境遇凄惨,命途多舛,因而他被误解为厌女主义者。但是,随着对其作品研究的深入,批评家们发现隐藏在文字之下的是福克纳对各类压制力量(包括父权力量)的批判和
多模态在人类信息传递和交际中无处不在,常指两个或两个以上模态资源来传递信息的符号系统。在传递信息的过程中又不可避免地涉及到了隐喻和转喻。轻轨标识是一个我们日常生活中常见的多模态语言象征符号,它是图像象征和文本象征的结合体。但是目前关于轻轨标识的大量研究仅仅局限于从静态角度分析其中的语言文字和功能语言学角度简要分析图文分布,而关于轻轨标识的多模态隐转喻意义构建的动态认知过程研究相对匮乏,尤其是重庆轻
新风负荷在大型公共建筑的空调能耗中占比较高,对新风负荷进行预测是降低建筑能耗、发展绿色建筑的有效途径。本课题分别针对商场类、旅店类、办公类三种不同类型的大型公共
可控励磁直线磁悬浮同步电动机是一种新型的直线电机,在励磁绕组通入电流产生电磁吸力,将平台悬浮在导轨上,实现了无摩擦运行,可以满足高精度数控机床对高定位精度和高速度的
P450超家族成员CYP17和CYP19分别是调控动物雄激素和雌激素合成的关键限速酶,在调控卵泡类固醇激素含量,维持卵泡生长发育过程中有重要作用。CYP17和CYP19在哺乳动物卵泡发育
近些年,随着生物医学水平和计算机技术的提高,人脸识别技术引起研究者们的广泛关注,其作为生物识别技术的一种,具有自然性和不容易被被测个体感知的特点,成为计算机视觉领域
污水污泥的处理是全世界急需解决的课题之一,它的排放不仅污染环境同时也是资源的浪费。热解是污泥等碳质资源提质利用的重要方式之一,但是污泥的高含氧量和高含氮量的特点限制了其热解提质。该论文在下坠式管式反应器中研究了污泥的催化热解,旨在降低热解液体产物中含氮和含氧类有机化合物(ONSs和OOSs),提高生物油品质。实验选取了三种不同类型的催化剂用于污泥快速热解挥发分的催化重整,分别是钙基催化剂(CBCs
图像融合是一种信息融合技术,为很多领域带来了实际的应用价值。对于图像融合任务来说,减少融合过程信息的丢失才能获得较好的融合结果。然而,现有的方法一定程度上存在信息