决策树和决策森林的深度强化学习归纳方法

来源 :重庆大学 | 被引量 : 0次 | 上传用户:oqo235
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习是人工智能中不可或缺的组成部分,近十年来得到越来越多研究者的青睐并且蓬勃发展,其中决策树因其简单易用且具有良好的可解析性成为机器学习经典的算法之一。然而最优决策树的归纳是NP完全问题,已有研究表明优化决策树归纳过程中的每一个树结点并不等价于优化整个决策树结构。目前决策树归纳算法大都采用贪心搜索策略,只考虑当前划分的信息增益,容易陷入局部最优,其次,在计算结点不纯度的过程中,信息增益等划分准则引进了样本分布的先验概率,使得决策树在处理不平衡数据时因偏向多数类而失效。此外,决策树模型容易产生过拟合,通常需要利用集成学习方法将多个树模型组合成决策森林以提高算法的泛化能力和鲁棒性。为解决贪心搜索策略容易使决策树归纳算法陷入局部最优的缺陷,本文提出了一种以最大化长期收益为目标,基于深度强化学习的决策树归纳框架DRLDT。DRLDT将决策树的归纳过程抽象为马尔可夫决策过程,利用树卷积将提取的树结构信息作为状态输入,把结点的表示与参数化动作空间相对应,最后使用已有的深度强化学习算法求解最优树结构的归纳策略。此外,为了能够灵活处理平衡数据和不平衡数据,DRLDT利用模型评估指标设计了奖励函数。在DRLDT基础上,本文提出了两种决策树归纳算法:MP-DQN-DT和Hybrid-SAC-DT。同时,本文在集中式训练分散式执行(CTDE)框架下将Hybrid SAC算法扩展到多智能体系统中得到MA-H-SAC算法,提出了一种基于MA-H-SAC的决策森林归纳算法MA-H-SAC-DF,其基分类器由一组智能体在一个共同目标下合作生成,是一种不同于Bagging、Boosting和Stacking的全新的集成学习策略。实验表明,本文提出的MP-DQN-DT算法在平衡数据和不平衡数据两种情况下分类性能均超过现有决策树归纳算法,Hybrid-SAC-DT算法在不平衡数据集下分类性能超过现有的决策树归纳算法,并且在平衡数据上的表现与后者相当。同时,本文提出的MA-H-SAC-DF决策森林归纳算法在不平衡数据上分类性能超过随机森林、Adaboost和梯度提升树,在平衡数据上的分类性能不亚于后者。
其他文献
“正义”,作为人类社会的基本价值追求和基本行为准则,古往今来,一直被人们所尊崇。对正义问题的研究伴随着人类社会的发展而从未停止,无数的思想家、哲学家和政治家对正义问题进行过深入的思考和详细的解读,有直接探究著书立说的,也有间接探究散见于其思想的,马克思就是其中的重要一环。他的正义思想是在批判、继承与创新古希腊哲学、德国古典哲学、英国古典政治经济学和法国空想社会主义的基础上发展而来的,它全然不同于维
学位
<正>省卫生健康委党组始终高度重视机关纪委建设,特别是河北省委办公厅《关于加强省直部门机关纪委建设的意见》出台后,省卫生健康委把深入学习贯彻落实《意见》作为一项重要政治任务,坚持问题导向,精准发力,扎实推进《意见》落地见效。配齐配强机关纪委工作人员,解决“有人干事”的问题。河北省卫生健康委点多、面广。
期刊
我国特高压和微电子行业的迅猛发展,对硅钢的质量提出了更高的要求。气垫式硅钢连退炉因其生产的硅钢带具有产品表面质量高、带钢组织性能好、生产效率高等优点而受到广泛关注。飘浮器作为连退炉的关键设备,其结构及工艺参数对飘浮器的流场、压力场以及温度场有重要的影响。通过数值模拟方法,研究了结构及工艺参数对飘浮器流场、压力场和温度场的影响,对飘浮器的结构进行了优化。在硅钢生产线上进行了现场实测,对带钢张力、飘浮
学位
颗粒流体两相湍流广泛存在于自然界和包括能源动力领域在内的各种工业过程中。研究湍流场中耗散尺度颗粒的湍流调制作用,对构建更完善的颗粒流体两相湍流相间作用模型具有重要意义,同时能帮助人们更好地理解相关自然现象和优化相关工业设备。由于颗粒流体两相湍流之间相互作用的复杂性,同时两相流动的实验测量数据不够丰富,目前耗散尺度颗粒对湍流调制作用的认识并不充分。本文在水平振荡双格栅湍流系统中,基于粒子图像测速技术
学位
目的 探讨小儿肺炎给予小儿肺咳颗粒联合阿奇霉素临床疗效及对炎性因子水平的影响。方法 选取2020年3月—2021年4月孝感市孝南区妇幼保健院收治的106例肺炎患儿,采用摸球法随机分为A组(n=53)与B组(n=53),B组给予单纯阿奇霉素治疗,A组加用小儿肺咳颗粒治疗。比较2组临床疗效、症状消失时间、炎性因子、肺功能及不良反应。结果A组治疗总有效率明显高于B组(P<0.05);A组症状(咳嗽、喘息
期刊
由于能源短缺问题和化石能源利用过程中产生的环境问题,太阳能作为一种可再生能源,以其清洁无污染的优势进入人们的视野。目前,太阳能光伏发电技术是太阳能利用的主要手段,在太阳能光伏发电中,为了降低成本,聚光光伏的发展引起人们的重视,而菲涅尔以其质量轻、成本低的优势在聚光光伏利用中应用广泛。本文以菲涅尔聚光光伏系统为研究对象,利用光-热-电-结构耦合的方法,在不同光伏板倾角(α)、聚光器竖直偏离焦距的距离
学位
报纸
<正>为贯彻落实《关于加强中央和国家机关部门机关纪委建设的意见》和省委《关于加强新时代贵州省直部门机关纪委建设的意见》精神,贵州省铜仁市通过制定一份意见、出台两个规定、压实三项职责、建立四个制度,构建起机关纪委建设的“四梁八柱”,进一步加强市直部门机关纪委建设,充分发挥市直部门机关纪委作用,着力解决监督“最后一公里”问题。
期刊
当今的无线通信系统处于高速发展时期,对天线的带宽和尺寸提出了更高的要求。与此同时,还要求天线要具有多功能的特性。准八木天线不仅具有结构简单、低剖面等优点,还具有定向辐射、大宽带等优异的多功能特性,成为宽带天线研究的重点。此外,螺旋天线因其与生俱来的宽带、圆极化等多功能特性被广泛研究。考虑当前无线通信系统对小型化、宽带化以及多功能天线的迫切需求,本文对两种类型的天线进行了小型化和宽带化的研究。主要内
学位
短线投资者“炒房”加重了首次置业者的购房负担,损害房地产市场平稳运行。打击短线投资者投机对房地产市场实现“房住不炒”有着重要的意义。为此本文分析论证了短线投资者购买低价房产从市场套利的机制,并基于此为政府完善住房市场体制,打击炒房,减轻居民住房负担提供了政策建议。理论上,由于住房具有高度异质性的,分析以上问题需要首先建立买方搜寻模型。买方信息差距与现金付款优势对房价的影响在理论上进行了比较静态分析
学位