非平稳MDP平均模型εn—最优策略的结构

来源 :湖南师范大学自然科学学报 | 被引量 : 0次 | 上传用户:skylfy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文考虑的是状态空间和行动空间均为一般集的非平稳MDP平均模型εn-最优策略的结构和性质,通过相应的一般决策模型的建立及εn-最优行动集Aεn的引入,讨论了εn-最优策略的凸组合,凸分解等若干性质。
其他文献
采用非交错多层笛卡尔网格离散计算区域,应用混合有限分析法(HFAM)离散控制方程,利用"边壁法向插值法"处理不规则边界,以改进的动量插值法(MIM)解决压力锯齿波问题,建立了一
以摩托车发动机弹性系统的动力学模型为基础,以降低整车的振动为目标,通过调整摩托车发动机的安装角度,将发动机不平衡力调至车架受力大或者对力不敏感的方向上,以此来减小摩
文章以华西村、义乌小商品城发展模式为主线,阐述了新时期中西部特别是欠发达地区中小城市如何结合自身实际借鉴南方发达地区发展模式的思路和方法,对加快调整优化县域经济结
本文给出了亚正定阵的左、右逆特征值问题有解的充要条件,并在有解时给出了解的通式。
1989年Temam R和Foias C利用所谓锥性质定理证实了一类耗散系统存在惯性流形,本文修改了起关键作用的锥性质定理,从而改进了惯性流形存在定理中的条件系数。
针对一类严格反馈形式的非线性不确定系统,提出了一种动态曲面鲁棒自适应控制方法.设计方案类似于backstepping方法,但该方法通过增加若干个低通滤波环节避免了backstepping
摘 要:老年人的社会支持与社会网络系统与他们的健康、养老状况、养老方式及死亡率等都有很大的关系。文章对近年来中西方在这方面的研究作了进一步的比较与论述。研究发现:目前定量研究是老年人社会支持与网络的主要研究方法,对社会支持进一步的质性研究相对较少。事实上在社会支持系统的研究中,涉及人类情感部分的分析才真正需要充分考虑,如果在社会网络、社会支持中人们的互动是负面的或社会支持的接受者认为价值不大,那么