POMDP相关论文
边缘计算作为一种缓解资源拥塞的策略,逐渐发展为满足物联网和本地计算需求的新范式。与传统云计算相比,边缘计算将大量的数据计算......
基于通信的列车运行控制(Communication Based Train Control,CBTC)系统是目前国内城市轨道交通中应用最广泛的列车控制系统,它以列......
移动机器人对环境感知问题的研究是移动机器人技术中的重要内容,特别是在路径规划方面的运用具有重要意义。在路径规划技术的研究......
The concept of proactive-optimization CR (POCR) is proposed to deal with the problem that the traditional assumption of ......
Partially Observable Markov Decision Process (POMDP) provides a probabilistic model for decision making under uncertaint......
动态不确定环境下的多主体决策是人工智能研究中的一个关键问题,该决策问题可以归结为高层的意图生成和"意图冲突"调解问题以及底......
随着无线通信技术的迅猛发展,急剧增长的业务需求与有限的频谱资源之间的矛盾日益突出。很多无线通信系统对相关授权频谱的利用率......
铁路货车运输能力的快速扩充和货车维修策略由计划修向状态修的转变为货车的维修管理带来了巨大挑战。车轮作为铁路货车的关键零部......
随着信息技术的发展,人们几乎可以在任意时间、任意地点实时地使用互联网提供的便捷服务,人与计算设备的交互越来越频繁,因此对交......
A non-myopic scheduling method of radar sensors for maneuvering target tracking and radiation contro
In decades, the battlefield environment is becoming more and more complex with plenty of electronic equipments. Thus, in......
Due to the problem of spectrum underutilization and energy inefficiency in wireless communications,the research on energ......
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生......
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7......
从多阶段、延迟回报的角度来看待CRM中的决策优化问题。以KDD98数据集为例,将邮寄序贯决策定义为一个部分可观察马尔可夫决策模型(PO......
由于多媒体业务需要更大的带宽和更高的实时性,所以对服务系统和接入控制提出了更高的要求。文章针对分布式媒体服务系统提出了一......
In traditional cognitive radio (CR) network,secondary users (SUs) are always assumed to obey the rule of “introducing n......
不确定性和隐状态是目前强化学习所要面对的重要难题.本文提出了一种新的算法MA.Q.learning算法来求解带有这种不确定性的POMDP问题近......
频谱接入技术的关键是解决认知用户如何选择合适的空闲信道以及认知用户间如何实现频谱共享。在公共控制信道较难获得的情况下,基......
通常利用POMDPs对在部分可观测的随机环境中决策的agents建模。针对完整POMDP的求解方法扩展能力弱的问题,提出把多元POMDP分解成多......
在认知无线电(CR)技术中,无线网接入是一个极为重要的问题。针对这一问题,当前主流的解决思路包括博弈算法和基于部分可观测马尔科夫......
针对利用多旋翼无人机自主定位无线电干扰源问题,为研究自主定位过程中使得定位效率最高的参数设置,基于部分可观测马尔科夫决策过......
本文研究了具有ARQ功能的基于衰落信道和数据链路层缓冲区队列状态的资源最优分配问题,目标是通过自适应调整功率分配和调制方式,在......
...
抽象层次上FO—POMDP的引入,使得人们可简洁地、陈述地表达复杂的POMDP,解决常规POMDP在实际中所无法解决的大规模决策问题。介绍了F......
在ad hoc网络中,由于受硬件和能量的限制,在没有数据发送的情况下,次用户无法监控到频谱,不能执行全频谱的感知,因此,针对现有的机......
为解决认知无线Mesh网络中专用控制信道较难获得的问题,提出一种基于POMDP的机会式频谱接入MAC协议,在不需要中心控制器和专用控制信......
研究了具有ARQ功能的基于衰落信道和数据链路层缓冲区队列状态的资源最优分配问题,为了通过自适应调整功率分配和调制方式,在系统......
通过将贝叶斯统计方法和POMDP(部分可观测马氏决策过程)方法相结合,采用计算机模拟的方式,预测在给定条件下可能产生的各种作战决策的......
A non-myopic scheduling method of radar sensors for maneuvering target tracking and radiation contro
In decades,the battlefield environment is becoming more and more complex with plenty of electronic equipments.Thus,in or......
为提高室内动态环境下服务机器人对行人的自然避让能力,对人的运动轨迹模式进行建模,在此基础上引入了将行人运动长、短期预测结合起......
密集组网是5G网络演进中的重要技术之一。随着网络的密集化,网络中各种低功率节点在热点地区大量部署,大幅提升网络容量的同时也给......
针对分布式系统存在的状态信息不完全问题,引入部分可观察的马尔可夫决策过程(POMDP)模型到生存控制系统中。在该控制系统的构造过......
随着空空导弹的不断发展,现代空战已经进入超视距空战时代。具备武器装备性能优势的一方,在接敌过程中大部分都倾向于避免“近身肉......
强化学习是Agent通过试错与环境交互改进动作策略,单Agent强化学习能够进行自学习和在线学习,单Agent的知识和资源是有限的,多个Ag......
针对盾构掘进过程中位姿控制问题,提出了基于部分可观测马尔科夫决策过程(Partially observable Markov decision processes, POMDP)......
随着无线通信技术的飞速发展,频谱资源日趋紧张,而认知无线电技术正是解决频谱短缺的最有前景的技术之一。对于不同的认知无线电系......
动态频谱接入(Dynamic Spectrum Access,DSA)技术是感知无线电的关键技术之一,由于受能量及硬件条件限制,提出了基于部分可观察马尔......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
针对机电装备运行维护问题,提出了基于部分可观察马尔可夫决策过程(POMDP)理论的动态可靠性评价方法。该方法将可靠性动态演变看成PO......
Evaluating Effects of Two Alternative Filters for the Incremental Pruning Algorithm on Quality of Po
Decision making is one of the central problems in artificial intelligence and specifically in robotics. In most cases th......
认知用户动态频谱接入是认知无线通信的关键,提出了一种多用户混合均衡频谱接入方法。该方法将认知用户机会频谱接入建模为部分可......
针对动态不确定环境下的机器人路径规划问题,将部分可观察马尔可夫决策过程(POMDP)与人工势场法(APF)的优点相结合,提出一种新的机......
部分可观察马尔可夫决策过程(POMDP)是描述不确定环境下进行决策的数学模型.基于点的值迭代算法是求解POMDP问题的一类近似解法.针对基......
规划是人工智能研究的一个重要方向,具有极其广泛的应用背景.近年来,研究重点已经转移到动态不确定性环境中的规划问题.该文将部分......
随着通信领域技术的发展以及无线通信业务的飞速前进,人们对频谱资源的需求也逐渐增高。为解决日益紧张的频谱资源稀缺问题,认知无......
随着科技的发展,人们可以使用与各种计算设备直接进行自然交互来得到越来越多以前需要和人交互才能得到的服务,比如,咨询客服智能......
为分布式视频点播(videoondemand,VOD)接入控制建立了基于POMDP(部分可观Markov决策过程)的数学模型,应用策略梯度优化算法仿真求解模型......
将交通自适应控制看成是POMDP(Partially Observable Markov Decision Process)问题,建立交叉口POMDP环境模型,结合值函数法的优点......