半Markov控制过程在折扣代价准则下的最优平稳策略

来源 :控制与决策 | 被引量 : 0次 | 上传用户:nikecb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
讨论一类半Markov控制过程(SMCP)的折扣代价性能优化问题.通过引入一个矩阵,该矩阵可作为一个Markov过程的无穷小矩阵, 对一个SMCP定义了折扣Poisson方程, 并由这个方程定义了α-势.基于α-势,给出了由最优平稳策略所满足的最优性方程.最后给出一个求解最优平稳策略的迭代算法,并提供一个数值例子以表明该算法的应用.
其他文献
线性时不变系统的静态输出反馈控制可行性等价于两个耦合的线性矩阵不等式解的存在性问题,这导致了一个非线性最优化问题,是无法直接求解的.针对线性时不变系统(LTI),深入研
为发现用户真正感兴趣的决策规则,利用RS理论和方法设计了个性化决策规则发掘算法.算法分为两步:首先在属性约简中通过提出的理论尽可能去除用户不感兴趣的属性的方法来找出
研究语言判断矩阵的满意一致性问题.在给出语言判断矩阵及其满意一致性有关概念的基础上,提出一种关于具有严格偏好关系的语言判断矩阵满意一致性的判定方法.依据所给出的判
提出一种基于双时钟的CDMA移动通信网络的拥塞软处理方法.该方法硬件实现简单,能动态分配移动通信网络资源,及时解除网络拥塞,使系统稳定工作.实验结果表明,该方法有效地保证
互联网中的拥塞控制是一个离散事件与连续变量相互作用的混杂动态过程.假定拥塞事件为一个更新过程序列,采用含有一个状态的随机混杂自动机模型,描述了TCP拥塞控制中的AIMD过