部分可观察马尔可夫决策过程相关硕士博士期刊学术论文

部分可观察马尔可夫决策过程相关论文

一种基于部分可观察马尔可夫决策过程的股票交易策略

近年来涌现了许多把深度强化学习应用到股票交易策略的研究。深度强化学习通常依赖于马尔可夫决策过程建模，但是股票市场中交易策略......

期刊

股票交易部分可观察马尔可夫决策过程优势演员评论家算法

基于部分可观察马尔可夫决策过程的引导式学习模型研究

随着知识技能日新月异,让训练对象尽可能快的通过学习掌握技能和知识,以满足不同任务的需求,已经成为非常重要的研究课题。因为不......

学位

强化学习部分可观察马尔可夫决策过程优先级引导式学习

基于部分可观察环境下的服务组合优化方案研究

在面向服务的体系架构中,通过将多个现有的服务集成为一个增值的组合服务以满足更复杂的需求,web服务组合为软件构建提供了一种新......

学位

Web服务组合部分可观察马尔可夫决策过程强化学习

OFDMA系统中基于决策理论的干扰协调技术研究

多小区OFDMA系统中,小区间干扰是影响系统性能的主要因素,干扰协调技术因为其实现简单且干扰抑制效果良好而倍受青睐。本文结合部......

学位

干扰协调 OFDMA系统部分可观察马尔可夫决策过程(POMDP) 蒙特卡洛采样

不确定性环境下基于进化算法的强化学习

不确定性和隐状态是目前强化学习所要面对的重要难题．本文提出了一种新的算法MA．Q．learning算法来求解带有这种不确定性的POMDP问题近......

期刊

部分可观察马尔可夫决策过程 Q学习 MEMETIC算法信度状态隐状态 POMDP Q-learning Memetic algorithm belie

基于动态跳频的频谱接入

在认知网络中,为了克服频谱接入方案中系统吞吐量普遍偏低的缺点,运用动态跳频技术,提出一种可以使次用户顺利切换到其他信道同时......

期刊

频谱接入频谱感知系统吞吐量动态跳频部分可观察马尔可夫决策过程 spectrum access spectrum sensing system thr

基于部分可观马氏决策的AUV全局路径规划

自治式水下机器人在复杂海洋环境航行时要求寻找一条从给定起始点到终止点的较优的运动路径,安全、无碰撞地绕过所有的障碍物。提......

期刊

自治式水下机器人部分可观察马尔可夫决策过程全局路径规划仿真 AUV Partially observable M arkov decision proc

基于信念重用的WSNs能量高效跟踪

针对无线传感器网络（WSNs）中目标跟踪性能与传感器能量消耗难以平衡问题,提出一种信念重用的WSNs能量高效跟踪算法。使用部分可观察......

期刊

无线传感器网络能量高效跟踪信念重用部分可观察马尔可夫决策过程 wireless sensor networks （ WSNs ） energy-eff

基于点的POMDPs在线值迭代算法

部分可观察马尔可夫决策过程（partially observable Markov decision processes，简称POMDPs）是动态不确定环境下序贯决策的理想模型，但......

期刊

部分可观察马尔可夫决策过程信念状态基于点的算法在线算法与或树 POMDPs belief state point-based algorithm

认知无线电中基于特征信念的协作频谱检测算法

针对认知无线网络(CRN)中频谱检测准确性与检测效率难以平衡的问题,本文提出一种特征信念的认知无线网络ED/FD协作频谱检测算法。......

期刊

认知无线网络频谱检测能量检测特征检测部分可观察马尔可夫决策过程 cognitive radio network spectrum sensing e

多小区OFDMA系统中基于POMDP的干扰协调

对OFDMA系统中的干扰协调进行了研究,提出了一种基于部分可观察马尔可夫决策过程理论的动态干扰协调算法。该算法结合干扰的统计模......

期刊

OFDMA系统多小区小区间干扰协调部分可观察马尔可夫决策过程 OFDMA system multi-cell inter-cell interfere

基于非负矩阵分解更新规则的部分可观察马尔可夫决策过程信念状态空间降维算法

针对求解部分可观察马尔可夫决策过程(POMDP)规划问题时遭遇的"维数诅咒",该文提出了一种基于非负矩阵分解(NMF)更新规则的POMDP信......

期刊

信息处理部分可观察马尔可夫决策过程信念状态空间非负矩阵分解值直接压缩维数灾 Information Processing Partially Obs

多智能体系统分散式通信决策研究

通信是多智能体系统(MAS)之间协调与协作的最有效和最直接的方法,然而通信的代价却限制了该方法的使用。为了减少MAS协调过程中的......

期刊

多智能体系统协作分散式通信马尔可夫决策过程部分可观察马尔可夫决策过程 Multi-Agent System （MAS） cooperation dec

POMDPs算法复杂度对比分析研究

部分可观察马尔可夫决策过程（ Partially Observable Markov Decision Processes, POMDPs ）是动态不确定环境下序贯决策的理想模型，但......

期刊

部分可观察马尔可夫决策过程序贯决策信念状态空间在线算法维数灾 POMDPs sequential decision-making belief stat

动态影响图模型研究

部分可观察马尔可夫决策过程在策略空间和状态空间上的计算复杂性,使求解其一个最优策略成为NP-hard难题.为此,提出一种动态影响图......

期刊

动态贝叶斯网络影响图马尔可夫决策过程部分可观察马尔可夫决策过程动态影响图 dynamic Bayesian networks influence dia

无线传感器网络目标跟踪动态簇成员调度策略

通过分析目标跟踪无线传感器网络监测精度、节点能量消耗与簇成员唤醒/休眠之间的内在联系,针对网络节点能量有限、密集部署节点监......

期刊

无线传感器网络目标跟踪部分可观察马尔可夫决策过程簇成员调度在线求解算法

WSN中一种目标追踪在线节点调度算法

针对目标追踪无线传感器网络节点能量有限、感知信息存在不确定性等问题,提出一种基于部分可观察马尔可夫决策过程的在线节点调度......

期刊

目标追踪无线传感器网络部分可观察马尔可夫决策过程节点调度可达信念与或树在线算法 target tracking Wireless Sensor Net

基于后验信念聚类的在线规划算法

在连续状态的部分可观察马尔可夫决策过程中，在线规划无法同时满足高实时性与低误差的要求。为此，提出一种基于后验信念聚类的在线规......

期刊

部分可观察马尔可夫决策过程后验信念聚类在线规划 KL散度分支界限 Partially Observable Markov Decision Process

动态不确定环境下的智能体序贯决策方法及应用研究

近年来,动态不确定环境下的智能体在线规划和学习引起了科学界的极大关注,已就智能体在决策时必须考虑各种不确定性作为设计健壮系......

学位

部分可观察马尔可夫决策过程信念状态空间基于点的在线值迭代贝叶斯增强学习无线传感器网络

基于部分可观察马尔可夫决策过程的多被动传感器组网协同反隐身探测任务规划

针对反隐身作战需求,提出多被动传感器组网协同战术。为提升反隐身探测效能,引入部分可观察马尔可夫决策过程（POMDP）理论,分析了POMD......

期刊

控制科学与技术传感器技术反隐身多传感器组网部分可观察马尔可夫决策过程信念状态任务规划

看过本文同时还关注