基于决策树的强化学习算法

来源 :2005第一届中国分类技术与应用研讨会(CSCA) | 被引量 : 0次 | 上传用户：gbbzwklk

【摘要】

：

在将强化学习应用于实际问题时,遇到的困难之一是如何根据连续的传感器输入信号来构造合适的状态表达.提出了一种自动构造状态空间的方法,采用基于决策树的强化学习模型,将传感输入空间离散化处理来构造一棵状态分类树,以便变分辨率地划分输入状态空间,并利用决策树来逼近值函数.提出的方法结合了基于短期记忆学习和统计推断方法的优点,仿真结果表明,该方法能够生成有效的状态表达和更快地进行学习。

【作者】

：

周浦城洪炳镕

【机构】

：

哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001

【出处】

：

2005第一届中国分类技术与应用研讨会(CSCA)

【发表日期】

：

2005年1期

【关键词】

：

强化学习 Q-学习决策树变分辨率划分离散化处理状态分类树

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

阳泉矿区煤层气开发利用现状及发展前景

阳泉煤业集团利用矿井煤层气作为城市煤气气源,已有30多年的历史,已累计供气66254万m3。介绍了阳泉矿区煤层气开发利用情况,存在的问题及今后发展前景。

会议

煤层气资源开发资源利用

基于语块的中文问句相似度计算

分析了当前常用的汉语句子相似度计算方法及存在的问题,针对中文问句的特点,定义了问句的常规和特定语块,提出了一种基于语块的中文问句相似度计算方法,该方法以"知网"为基础,计算词语语义相似度,利用组块分析理论及HMM学习算法,识别问句常规语块,利用规则或学习方法提取问句特定语块,并分别计算两个问句中各问句语块之间的相似度,最终以语块相似度为基础实现问句相似度的计算.问句相似度计算方法对比实验结果说明,

会议

句子相似度问句相似度语块相似度词相似度常规语块特定语块分类技术

基于分析Fourier-Mellin变换的图像配准

Fourier-Mellin变换(FMT)通常用于基于内容的图像检索和数字图像水印.将FMT的应用扩展到图像配准,并提出基于FMT的改进的配准算法,以便对由平移、旋转和比例变换而产生的偏移图像进行调整.提出的算法能消除从笛卡尔坐标到对数极坐标的转换,避免在转换过程中所需的插值,同使用相关函数的传统方法相比获得了显著的改进.实验表明,该算法在白噪声存在的情况下能获得准确鲁棒的结果。

会议

图像配准Fourier-Mellin变换几何变换逼近偏移图像调整

基于K-Means特征加权算法的大规模文本数据子空间聚类

文本聚类是利用聚类技术对大量的文本数据进行分析,把内容相似的文本放在同一个集合.针对基于k-means特征加权算法用于文本子空间聚类的性能进行了一系列的实验研究与分析,并验证得出该算法具有可伸缩性与快速收敛性.文本子空间聚类算法的提出是针对文本数据的两大特点:高维与稀疏性.该算法基于传统的k-means聚类方法,将特征加权加入到k-means迭代的过程中.在聚类文本的同时,对文本集所包含的单词(特

会议

子空间聚类文本挖掘特征加权可伸缩性k-means特征加权

基于结构分析与计算的问答系统问题分类

问题分类是问答系统技术处理的基础与核心,它决定答案抽取的范围和方法,进而影响整个系统的性能.通过对比分析问题分类与文本分类的异同以及问句内部结构与问题类型之间的关系,提出了一种新的基于贝叶斯理论的问题分类计算模型.通过对比实验,证明在计算模型中增加特征项扩展可以有效地减小问句较短和标注语料库较小对统计结果的影响,而基于疑问词的2-gram组合,较好地利用了问句结构特征,提高了问题分类的精确度。

会议

结构分析结构计算问答系统问题分类贝叶斯模型问句结构

k-均值算法家族和子空间聚类

k-均值是著名的聚类算法,被广泛应用在诸多领域.经过多年发展,原始的MacQueenk-均值算法已经衍生出多种变形,构成了k-均值算法家族.首先回顾k-均值家族重要成员:k-均值(k-means)、k-模(k-modes)、k-原型(k-prototypes)算法和它们的模糊版本,然后提出两个新成员--变量自动加权的k-均值算法,并讨论它们在子空间聚类中的应用.文本数据的实验结果表明,变量自动加权

会议

k-均值算法模糊k-均值k-模变量自动加权文本挖掘子空间聚类

AS-ROCK——一种基于公共近邻结合离群点识别的聚类算法

减少算法参数对聚类效果的影响,是聚类分析技术需要解决的一大难题.提出与离群点识别方法相结合以弥补聚类技术不足的新思路.在提出基于公共近邻的离群点概念之后,给出一种借助离群点信息自动停止聚类过程的聚类算法,该算法只需一个参数,参数的恰当取值范围可以依据识别离群点的情况确定.算法兼具处理类别属性和数值属性数据的能力.在分析过新算法一些特点后,用6个数据集测试新算法的效果,并与多种聚类算法进行对比,实验

会议

聚类算法离群点识别自动终止公共近邻数据集测试

一种简化的进化神经网络方法及其对复杂气层的识别

在复杂气识别中,单纯使用神经网络存在因输入信息空间维数较大而使网络结构复杂、训练时间长,以及因冗余属性使网络拟合精度不高等缺点,为此提出一种简化的进化神经网络方法,主要包括基于粒度相似度的连续属性离散化算法;基于粗糙集的属性约简算法;基于粒子群进化计算的网络学习训练算法;以及基于黄金分割的隐含层节点数的优选等步骤.通过长庆复杂气层的实际应用表明,这种简化的进化神经网络方法不仅满足识别系统的精度要求

会议

进化神经网络属性约简粒度相似度粒子群算法黄金分割法复杂气层识别

基于最小最大模块化支持向量机的多标号文本分类

提出了一种新的解决多标号文本分类问题的方法.对于一个K类多标号问题,首先采用"一对其他"的问题分解方法将原问题分解为K个两类问题;然后按照最小最大模块化支持向量机(M3-SVM)的"部分对部分"问题分解方法,再对这些两类问题进一步分解.这种方法的特点是能将大规模、训练样本极不平衡的两类问题分解成用户希望的任意大小的相对平衡的两类问题,并能容易地实现并列学习.对读卖新闻日文数据集和路透社英文数据集进

会议

多标号文本分类最小最大模块化支持向量机并列学习

一种约束关联规则挖掘算法的实现

约束关联规则挖掘是数据挖掘的重要课题之一,由于能够利用约束条件削减搜索空间,提高挖掘效率,因而受到广泛关注.为更灵活地表达用户的兴趣所在,提出规则格式约束的概念,并以Direct算法为基础,实现了一种基于规则格式约束的关联规则挖掘算法MRCAR.算法首先利用Direct算法挖掘满足规则格式约束条件的频繁项集,然后利用规则格式约束条件限制无关规则的产生.减少了侯选项集和关联规则的产生数目,提高了算法

会议

数据挖掘关联规则规则格式约束侯选项集

基于决策树的强化学习算法

与本文相关的学术论文