马氏决策过程相关论文
在大数据爆炸的时代,网络舆情、尤其是负面网络舆情管理,已成为管理层面临的难题和亟需解决的决策问题.基于目前涉警网络舆情事件......
非合作目标的侦察是包括安防、数字化城市等众多领域数字化、智能化系统的重要基础。进行非合作目标侦察往往使用多种探测手段,其......
本文研究随机环境对于连续时间马氏决策过程最优控制问题的影响,给出有限水平最优控制存在的判别条件,将研究扩散过程最优控制问题......
本文用马氏决策过程方法来讨论离散事件系统(DES)的静态稳定性问题,包括强吸引域和弱吸引域的计算,同时讨论了弱吸引域的稳定控制......
随着网联自动驾驶、智慧城市、远程医疗等垂直行业的发展,网络运营商需要在有限的资源内为用户提供多样化定制化的服务,网络切片技......
产品更新换代速率越来越快,为了满足不同消费者的多样化需求,厂商往往采用共生换代策略,且互联网背景下的消费者越来越“聪明”,厂......
随着技术的发展与社会的进步,产品的耐用性与企业更新换代速度的加快成为了一种矛盾,越来越多的企业开始开展以旧换新活动来解决这......
本文考虑平均准则模型马氏决策过程的一种改进的策略迭代算法:即时差分(TD:Temporal-Differences)策略迭代法.通过引入所谓即时差......
该文考虑平均堆则模型马氏决策过程的一种改进的策略迭算法—即时差分(TD)策略迭代法。通过引入所谓即时差分的概念,将传统的策略迭......
该文讨论离散事件动态系统的监控理论与马氏决策过程(随机动态规划)理论在模型上的相同性,并用马氏决策过程来统一描述和求解监控理论......
本文分以下三个方面对新技术投资决策问题进行了分析:创新成果的市场分析、技术选择以及容量扩张。在创新成果的市场分析方面,介绍了......
针对航食配餐中餐食浪费及加餐操作频繁的现状,本文应用马氏决策过程及混合整数随机动态规划方法,研究了随机需求条件下多阶段多产......
该文研究一个有限阶段离散时间动态投资决策模型.该文用连续状态的基于决策空间的马氏决策过程去描述该投资者的决策过程及其财富......
在讨论连续时间马氏决策过程(CTMDP)的文献中,对于转移速率qij(t),常见的假设是:(a)qij(t)是一致有界的[1-4];(b)qij(t)关于t是连......
对于一般的MDP模型,本文证明了对任意一族依赖于历史的随机策略所导致的策略测试类的任意凸组合,存在一个随机马氏策略所导致的策略测试......
讨论基于线性近似的即时差分(TD(λ))学习和最小二乘即时差分(LSTD)学习算法以逼近一平均报酬准则的马氏决策过程的相对值函数,逼......
为了有效解决零售商在销售易逝品时的订货、旧产品处理及定价的联合决策问题,提出运用马氏决策过程建立模型及使用Q学习算法求得最......
研究了送修时机的最优决策问题,为维修中心带备件库存情况下的送修决策问题建立了离散决策时刻、无限阶段的折扣马氏决策过程(MDP)......
研究了仓库容量可以控制的、基于折扣准则的多周期随机存贮模型.利用马氏决策过程(MDP)的方法,建立了最小折现成本所满足的最优方程,在......
针对监测费用昂贵导致难以实施连续监测和维修效果通常不完美的问题,研究了维修效果不完美情形下部分可观测系统的最优维修策略.在假......
本文讨论随机消费-投资最优控制问题,提出一类有约马氏决策模型,用线性规划方法给出最优随机平稳策略。......
本文有两个目的.第一,对Bandit过程这一学科的主要概念及结果作一次系统性的介绍.第二,综述Bandit过程的模型,计算与应用的最新发......
无线通信网络由于采用固有广播对干扰攻击是十分脆弱的,通常可采用跳频策略(FH)和传输速率适配(RA)来减轻干扰。然而大量研究表明单独......
这篇论文在波兰的空格为连续时间的 Markov 决定过程学习限制一般水准变化标准。把途径基于二,这份报纸证明变化最小化 optimality ......
本文讨论离散型冲击折扣半马氏决策过程,在建立模型后,我们将它化成了一个等价的离散时间马氏决策过程。......
...
该文考虑的是可数状态空间有限行动空间非齐次马氏决策过程的期望总报酬准则,与以往不同的是,我们是通过扩大状态空间的方法,将非齐次......
武器系统目标分配是作战指挥中的一个重要问题。本文将马尔可夫决策过程理论应用于目标分配决策中。这种方法充分考虑了攻防对抗这......
在最近的二十年中,人们对数据中心节能管理的研究给予了相当大的关注。一方面,随着数据中心的数量和规模迅速增加,巨大的能耗已成......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
现有移动通信系统的分层结构决定了各子层技术只能保证局部最优的系统性能,跨层优化设计打破了传统的层次结构,对各子层的关键技术......
讨论了向量值离散时间平均准则下的有限马氏决策模型;在采取确定性平稳策略时所得马氏决策过程为遍历的假设下,证明了存在一个至多在......
对广泛存在的一类事件驱动的平均费用型马尔可夫决策问题,通过分析其模型特征,研究了一种简单的增强型学习算法,不必将事件扩充为系统......
针对部件间存在经济相关性的复杂系统,提出一类基于机会策略的视情维修优化模型。模型从部件本身的失效规律分析出发,确定不同失效......
为生产生活中提供服务和支持的环节,因其重要性,越来越吸引人们对其分析和优化的关注。本研究中昂贵设备的部件联合更换问题即是一......
讨论了连续时间马氏决策过程中最优平稳策略对折扣因子的灵敏度问题,并将之化为一个多项式问题来求解。......
对平均准则的讨论一直是马氏决策过程研究的热点之一,近几年已从最优方程推广到最优不等式。本文系统地了介绍最优不等式的提出及其......
本文研究平均报酬马氏决策过程(MDP)的相对值迭代算法,给出了span半范数压缩因子的一个表达式,证明了该因子小于1时本文给出的相对值迭代算法及......
本文对可数状态集、非空决策集、报酬无界的平均准则马氏决策过程,提出了一组新的条件,在此条件下存在(ε)最优平稳策略,且当最优......
维修问题是影响工业、军事、航空等领域发展的一个关键因素,与工业生产率、产品质量、工业设备或军事装备的可靠性水平、资源消耗......
分析了折扣准则下单产品的多阶段存贮、定价及容量扩张问题.运用马氏决策过程,在有限阶段对存贮定价问题进行了讨论,得到了其最优......