【摘 要】
:
本文将Markov性能势理论推广到了半Markov过程,在此基础上,讨论了一类具有可数状态空间的半Markov控制过程的稳态性能灵敏度分析和优化问题,并给出了优化算法。 本文利用
论文部分内容阅读
本文将Markov性能势理论推广到了半Markov过程,在此基础上,讨论了一类具有可数状态空间的半Markov控制过程的稳态性能灵敏度分析和优化问题,并给出了优化算法。
本文利用等价无穷小矩阵,定义了半Markov过程的Poisson方程,并由Poisson方程的解定义了半Markov过程的性能势;讨论了半Markov过程的稳态性能灵敏度分析问题,给出了灵敏度公式,建立了基于性能势的优化理论,讨论了半Markov控制过程在无限水平平均代价准则下的最优平稳策略问题,给出了基于性能势的比较原理和平均代价最优性方程,给出了求解最优(次最优)平稳策略的理论优化算法,包括梯度算法,策略迭代算法和数值迭代算法,并证明了算法的收敛性,证明了其满足Poisson方程,给出了基于样本轨道的估计公式,由此讨论了基于样本轨道的仿真优化算法,这些算法可用于解决大规模实际系统中存在的“维数灾”或“模型灾”问题,建立了相应的并行算法,用来解决计算机的内存容量限制问题和运算时间问题,加快了寻优速度。
其他文献
燃气远程抄表系统用于城市中智能小区抄表,解决了过去靠人工入户抄表的难题,使燃气管理部门、小区物业公司的抄表业务实现信息化和智能化。 本论文讨论了燃气远程抄表系统
随着计算机技术的发展,图像目标的检测与识别己在很多领域得到了广泛的应用。目标检测与识别存在的关键问题是分割,即如何从复杂的背景中提取出目标,且具有较好的鲁棒性。本文主
远程教学作为一种新型的教育模式已成为近年来各国教育界的重要研究课题。基于Internet的虚拟仿真实验室是现代远程教学质量提高的关键,因为实验是大部分工程类和应用类课程
制袋是软包装印刷生产线上的一个重要组成部分,制袋机是制袋工序的主要加工设备。制袋工序控制包括定位、定长、烫封、牵引和分切等环节,本文研究了烫封温度控制技术。工业电
随着我国经济的飞速发展,城市车流量高速递增,交通变得越来越拥挤。实现实时的城市交通智能监控,对于交通信息收集、规范交通管理以及减少交通事故等方面都具有重要的现实意义。论文以广东某公司的“视频检测闯红灯自动记录仪”课题为背景,在研究视频处理的运动检测基础之上,分析了各自的优缺点,提出了两种检测违章车辆的方案,形成了一种违章车辆检测算法,实际应用结果证明了这一算法的有效性。论文提出了“虚拟线圈”的概念
船舶运行在海洋上,对于人们来说,其安全性和高效性是最重要的。为了节省时间和运输成本,人们一直都在进行对船舶操纵运动的研究和探索。从理论的层面上对船舶运动展开研究自然离
本文的主要内容是车牌识别系统的算法研究。论文首先简要地介绍了车牌识别技术的研究现状,然后结合我国当前使用的机动车牌照的规格特征对车牌识别技术的基本原理及主要图像
在建筑物中,暖通空调(HVAC)设备的目的是给业主提供安全舒适的环境。与此同时,业主和管理人员希望HVAC设备能具有低的管理和维护费用。对HVAC系统来说,既要保持安全舒适的环境,又要节省能源,那么高质量的控制方法就很重要。在HVAC控制系统中,普遍使用比例积分控制器(PI),比例积分控制器有两个影响控制器性能的参数,并且控制器使用自带的默认参数。对有些系统来说默认参数并不适合,会导致控制性能的下
计算机辅助安全评价是现今不少学者进行研究的领域。由于人工安全评价精度不高、速度慢、操作复杂,且评价周期长、代价昂贵,所以实现计算机辅助安全评价已经成为很多企业亟待
大气能见度与陆上交通、航空、航海、天文观测、高空摄影以及军事行动等活动都息息相关。航空、航海、陆地交通、电力供应以至于市民的日常生活都会受到低能见度的影响,甚至带