新的启发式Q学习算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:baimeng1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对连续型强化学习问题,提出一种综合启发函数和评估函数的Q学习算法,利用启发函数加快学习速度,采用评估函数减少不必要的探索,提高学习效率。为了保证该算法的有效性,启发函数和评估函数根据Q函数进行计算。坦克大战游戏的仿真实验结果证明,该方法可以较大地提高Q学习的学习效率。
其他文献
报告1例右侧椎动脉夹层动脉瘤破裂患者的紧急救护及临床甄别。对患者在急救过程中的病情评估、出血的护理与血压控制的目标及转运护理进行探讨,分析疾病的特征和救护过程的成
社会主义的医院文化展示出的是一种先进的意识形态,它具有振奋医院精神、提高员工素质、塑造医院形象、凝聚群体意志的重要作用。近年来,随着社会发展步伐的不断推进和意识形态
现代科技在提高治疗疾病疗效的同时,也带来了高消耗甚至高污染。文章从现代医疗发展带来的高消耗高污染人手,提出医疗行业不能盲目发展高新技术、崇拜高新设备和器材,要在提高外
为能在全局范围内快速搜索到优化的布局结果,提出一种基于量子模型的布局算法,并结合传统模拟退火算法实现FPGA布局。测试结果表明,相比VPR布局算法,该算法的布局运行速度平均提
一些基于图结构的索引技术通过缩小查询范围提高对XML数据的查询速度,但存在分隔不相关节点的问题。该文改进M*(k)-index的构造算法,用单一的M**(k)-index结构取代原算法的序列结构,以
目的研究AFP—L3、GP73及AFP在肝动脉化疗栓塞(TACE)联合射频消融(RFA)治疗老年人肝癌(PHC)前后血清水平的变化。方法42例PHC老年患者治疗前均接受肝穿刺病理证实,在TACE联合RFA(双介
肝移植是目前针对各种终末期肝病最有效的治疗手段,手术成功率已超过90%,但我国患者的总体生存率仍低于西方国家,其中一个重要原因是肝移植患者术后管理及随访体系不健全,健康教育
在Canny算法框架下,对图像进行多尺度滤波分析。定义尺度乘积函数为2个不同尺度滤波器的响应乘积,由相邻尺度近似性确定乘积后的幅值和相角,再选择阈值剔除伪边缘,由非极大值抑制得到图像边缘。实验结果表明,算法比传统Canny算子在噪声抑制和边缘定位方面具有更优的性能。
战略管理无疑是所有企业或组织最为关注的问题,医院组织当然也不例外。随着社会保健意识的日益增强以及医院专科化趋势的日趋膨胀,医院组织面临着前所未有的机遇与挑战,广州市第
针对眼睛状态检测在实际疲劳监控系统应用中的缺陷,在定位眉毛和眼睛区域的前提下,结合图像处理、复杂度、混合投影和眼睛的几何特征,提出一种快速的眼睛状态检测方法。给出具体检测步骤和主要算法实现。实验结果表明,该算法可用于不同背景、旋转和偏转角度等多种复杂条件下的眼睛检测,通用性好,处理速度快,并解决了偏光和戴深色边框眼镜的情况。