半Markov控制过程在折扣代价准则下的最优平稳策略

来源 :控制与决策 | 被引量 : 0次 | 上传用户：nikecb

【摘要】

：

讨论一类半Markov控制过程(SMCP)的折扣代价性能优化问题.通过引入一个矩阵,该矩阵可作为一个Markov过程的无穷小矩阵, 对一个SMCP定义了折扣Poisson方程, 并由这个方程定义

【作者】

：

殷保群李衍杰周亚平奚宏生

【机构】

：

中国科学技术大学

【出处】

：

控制与决策

【发表日期】

：

2004年6期

【关键词】

：

半Markovr控制过程折扣代价准则折扣Poisson方程 α-势最优性方程最优平稳策略 Decision making Iterative metho

【基金项目】

：

国家自然科学基金，安徽省自然科学基金

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

讨论一类半Markov控制过程(SMCP)的折扣代价性能优化问题.通过引入一个矩阵,该矩阵可作为一个Markov过程的无穷小矩阵, 对一个SMCP定义了折扣Poisson方程, 并由这个方程定义了α-势.基于α-势,给出了由最优平稳策略所满足的最优性方程.最后给出一个求解最优平稳策略的迭代算法,并提供一个数值例子以表明该算法的应用.

其他文献

基于结构Lyapunov矩阵的静态输出反馈镇定

线性时不变系统的静态输出反馈控制可行性等价于两个耦合的线性矩阵不等式解的存在性问题,这导致了一个非线性最优化问题,是无法直接求解的.针对线性时不变系统(LTI),深入研

期刊

静态输出反馈结构Lyapunov矩阵线性矩阵不等式Linear systemsLyapunov methodsMatrix algebraOptim

个性化决策规则的发现：一种基于Rough Set的方法

为发现用户真正感兴趣的决策规则,利用RS理论和方法设计了个性化决策规则发掘算法.算法分为两步:首先在属性约简中通过提出的理论尽可能去除用户不感兴趣的属性的方法来找出

期刊

个性化决策规则粗糙集约简知识发现Information theoryKnowledge based systemsRough set theory

语言判断矩阵满意一致性的判定方法

研究语言判断矩阵的满意一致性问题.在给出语言判断矩阵及其满意一致性有关概念的基础上,提出一种关于具有严格偏好关系的语言判断矩阵满意一致性的判定方法.依据所给出的判

期刊

语言判断矩阵满意一致性判定方法linguistic judgment matrix satisfying consistency judgment m

基于双时钟的CDMA移动通信网络拥塞软处理方法

提出一种基于双时钟的CDMA移动通信网络的拥塞软处理方法.该方法硬件实现简单,能动态分配移动通信网络资源,及时解除网络拥塞,使系统稳定工作.实验结果表明,该方法有效地保证

期刊

SIR功率控制接入控制拥塞缓解流量控制软处理HardwareMobile telecommunication systemsQuality of

TCP拥塞控制的混杂建模与分析

互联网中的拥塞控制是一个离散事件与连续变量相互作用的混杂动态过程.假定拥塞事件为一个更新过程序列,采用含有一个状态的随机混杂自动机模型,描述了TCP拥塞控制中的AIMD过

期刊

拥塞控制混杂系统混杂自动机Computer networksHybrid computersNetwork protocols

半Markov控制过程在折扣代价准则下的最优平稳策略

其他学术论文