马氏决策过程相关硕士博士期刊学术论文

马氏决策过程相关论文

基于大数据的涉警网络舆情多阶段干预决策建模研究

在大数据爆炸的时代,网络舆情、尤其是负面网络舆情管理,已成为管理层面临的难题和亟需解决的决策问题.基于目前涉警网络舆情事件......

期刊

涉警网络舆情大数据马氏决策过程动态优化干预策略

基于雷达与PTZ摄像机网络的协同侦察研究

非合作目标的侦察是包括安防、数字化城市等众多领域数字化、智能化系统的重要基础。进行非合作目标侦察往往使用多种探测手段,其......

学位

摄像机标定协同调度马氏决策过程协同侦察

基于马氏决策过程的多域网络切片资源管理

随着网联自动驾驶、智慧城市、远程医疗等垂直行业的发展,网络运营商需要在有限的资源内为用户提供多样化定制化的服务,网络切片技......

学位

多域网络切片资源管理马氏决策过程可持续收益

共生换代背景下面向策略型消费者的联合策略研究

产品更新换代速率越来越快,为了满足不同消费者的多样化需求,厂商往往采用共生换代策略,且互联网背景下的消费者越来越“聪明”,厂......

学位

策略型消费者共生换代联合策略预售马氏决策过程 Q学习算法

以旧换新背景下的企业多周期动态定价与订货联合策略研究

随着技术的发展与社会的进步,产品的耐用性与企业更新换代速度的加快成为了一种矛盾,越来越多的企业开始开展以旧换新活动来解决这......

学位

以旧换新马氏决策过程 Q学习算法

新技术投资决策

本文分以下三个方面对新技术投资决策问题进行了分析：创新成果的市场分析、技术选择以及容量扩张。在创新成果的市场分析方面，介绍了......

学位

新技术投资决策技术创新技术选择容量扩张马氏决策过程

备货型商品在(R，d)策略下的利润函数

本文主要讨论备货型商品在(R,d)策略下的利润函数,采用的手段就是马氏决策过程,构造HJB方程,然后利用差分方程的技术求解出利润函......

学位

备货型商品系统动态价格需求过程管理马氏决策过程利润函数

连续时间马氏决策过程的基本假设

在讨论连续时间马氏决策过程(CTMDP)的文献中,对于转移速率qij(t),常见的假设是:(a)qij(t)是一致有界的[1-4];(b)qij(t)关于t是连......

期刊

连续时间马氏决策过程基本假设转移速率一致有界处处连续文献

基于线性近似的即时差分学习

讨论基于线性近似的即时差分(TD(λ))学习和最小二乘即时差分(LSTD)学习算法以逼近一平均报酬准则的马氏决策过程的相对值函数,逼......

期刊

即时差分学习线性近似马氏决策过程最小二乘算法平均报酬准则强化学习函数近似方法 temporal difference learning linear

基于马氏决策过程的易逝品联合策略

为了有效解决零售商在销售易逝品时的订货、旧产品处理及定价的联合决策问题,提出运用马氏决策过程建立模型及使用Q学习算法求得最......

期刊

易逝品马氏决策过程 Q学习算法订货策略定价策略 perishable product Markov decision process Q-learni

考虑仓库容量扩张的多周期随机存贮模型——折扣准则

研究了仓库容量可以控制的、基于折扣准则的多周期随机存贮模型．利用马氏决策过程（MDP）的方法，建立了最小折现成本所满足的最优方程，在......

期刊

存贮论马氏决策过程折扣准则订货仓库容量 inventory theory Markov Decision Process discounted cr

不完美维修情形下部分可观测系统的最优维修策略

针对监测费用昂贵导致难以实施连续监测和维修效果通常不完美的问题，研究了维修效果不完美情形下部分可观测系统的最优维修策略．在假......

期刊

马氏决策过程不完美维修维修决策信息状态 Markov decision process imperfect maintenance maintenan

Bandit过程及其应用

本文有两个目的.第一,对Bandit过程这一学科的主要概念及结果作一次系统性的介绍.第二,综述Bandit过程的模型,计算与应用的最新发......

期刊

应用 Bandit过程动态规划马氏决策过程最优决策近视决策 Bandit processes dynamic programming Markov de

基于博弈论的无线通信抗干扰动态跳频和传输速率适配算法

无线通信网络由于采用固有广播对干扰攻击是十分脆弱的,通常可采用跳频策略（FH）和传输速率适配（RA）来减轻干扰。然而大量研究表明单独......

期刊

动态跳频干扰马氏决策过程速率适配 dynamic frequency hopping jamming Markov decision-making pro

Variance minimization for continuous-time Markov decision processes： two approaches

这篇论文在波兰的空格为连续时间的 Markov 决定过程学习限制一般水准变化标准。把途径基于二，这份报纸证明变化最小化 optimality ......

期刊

最小方差连续时间马氏决策过程最小化马尔可夫决策过程解的存在性最优不等式空间变异 Continuous-time Markov decision p

数据中心的节能管理及其最优动态节能策略研究

在最近的二十年中,人们对数据中心节能管理的研究给予了相当大的关注。一方面,随着数据中心的数量和规模迅速增加,巨大的能耗已成......

学位

数据中心节能策略异步节能策略排队论 RG分解马氏决策过程灵敏度优化理论

基于增强学习和车辆动力学的高速公路自主驾驶研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们......

学位

自主车自主驾驶增强学习马氏决策过程车辆动力学仿真汇入车流最短安全距离

无线通信系统中的跨层优化技术研究

现有移动通信系统的分层结构决定了各子层技术只能保证局部最优的系统性能,跨层优化设计打破了传统的层次结构,对各子层的关键技术......

学位

跨层优化设计有限长队列模型多天线检测马氏决策过程球形译码多基站协作无线传感网

基于机会策略的复杂系统视情维修决策模型

针对部件间存在经济相关性的复杂系统,提出一类基于机会策略的视情维修优化模型。模型从部件本身的失效规律分析出发,确定不同失效......

期刊

视情维修机会策略劣化系统马氏决策过程

多链马氏决策优化理论研究及在联合更换问题中的应用

为生产生活中提供服务和支持的环节,因其重要性,越来越吸引人们对其分析和优化的关注。本研究中昂贵设备的部件联合更换问题即是一......

学位

离散决策优化马氏决策过程近似动态规划多部件维修联合更换

报酬无界的平均准则马氏决策过程

本文对可数状态集、非空决策集、报酬无界的平均准则马氏决策过程,提出了一组新的条件,在此条件下存在(ε)最优平稳策略,且当最优......

期刊

马氏决策过程平均准则最优不等式无界报酬非空决策集 Markov decision process average criterion optimalit

多部件系统视情维修决策技术研究

维修问题是影响工业、军事、航空等领域发展的一个关键因素,与工业生产率、产品质量、工业设备或军事装备的可靠性水平、资源消耗......

学位

多部件系统视情维修经济相关性机会策略马氏决策过程迭代算法

考虑容量决策的多阶段存贮定价模型

分析了折扣准则下单产品的多阶段存贮、定价及容量扩张问题.运用马氏决策过程,在有限阶段对存贮定价问题进行了讨论,得到了其最优......

期刊

产品定价马氏决策过程存贮论容量扩张

面向多机器人系统的增强学习研究进展综述

基于增强学习的多机器人系统优化控制是近年来机器人学与分布式人工智能的前沿研究领域.多机器人系统具有分布、异构和高维连续空......

期刊

多机器人系统多智能体增强学习随机对策马氏决策过程

看过本文同时还关注