马尔可夫决策过程相关论文
为了缓解数据中心综合运行成本高、电网侧负荷峰谷差大的问题,提出一种基于马尔可夫决策过程与交替方向乘子法结合的数据中心储能系......
机载防撞系统是保障飞行安全的重要组成部分,民航客机已被要求必须安装机载防撞系统。随着飞行环境逐渐复杂化,当今广泛使用的机载......
本文提出了一种基于局部线性时序逻辑任务描述的滚动时域多机器人协同规划在线合成方法,初步解决了如何在建模为马尔可夫决策过程......
针对边缘计算应用对实时性的要求,引入软件定义网络和网络功能虚拟化技术对边缘计算网络进行重构.基于此,考虑以最大化长期平均实......
多功能雷达是现代电磁战场上不可或缺的重要装备,针对多功能雷达的干扰一直是一个难题。本文在研究多功能雷达信号特点和雷达对抗过......
随着客户多样化需求不断提升,根据客户对订单的不同需求来组织生产的订单生产型(Make-To-Order,MTO)模式在企业生产活动中越来越重要......
由于传统基于固定加工环境的工艺路线制定规则,无法快速响应加工环境的动态变化制定节能工艺路线。因此提出了基于深度Q网络(deep Q ......
民航业的快速发展为民用航空运输机场带来了大量的起降航班和乘客的同时,影响了民用运输机场的运行效率,增加了机场管制人员的工作......
为对法官员额资源进行调度优化,平衡司法资源有限和现实司法需求之间的矛盾,该文建立审判人力资源调度优化模型,提出基于强化学习的审......
移动边缘计算技术为低时延要求、资源敏感的计算任务需求提供解决方案,通过研究任务请求特征以提高调度算法效率是边缘计算的重要研......
在对远程支援干扰飞机雷达干扰资源调度问题具体分析的基础上,基于雷达对抗推演仿真平台,将组网雷达干扰资源调度问题建模为一个带......
本文针对污水处理精准曝气过程的智能控制方法进行研究。依靠人工经验的曝气方法存在能源的浪费,为降低曝气能耗,需要对曝气过程进......
本文研究非标机械零部件网上采购平台环境下的资源优化调度问题,解决传统的非标机械零部件线下采购中的采购垄断、采购供需间响应......
随着全球城市化进程的加速发展,交通安全与拥堵、环境污染等问题日益严重。自动驾驶技术有望解决这些问题,并已成为现代汽车技术的......
针对无人机地面动态目标跟踪问题,建立了远距离自主引导与近距离伴飞避障两个阶段的马尔可夫决策过程模型。在此基础上,提出了一种改......
随着我国城镇化的逐步推进和人民对生活舒适度的不断提高,建筑能耗已经逐步成为社会总能耗中不可忽视的组成部分。城镇供暖能耗在......
针对机位再分配算法结果难以满足不同操作人员操作习惯的问题,提出一种符合实际业务人员操作习惯的机位再分配推荐算法。首先以航班......
本文采用性能势理论和方法,研究了动态控制系统的学习和优化的问题。性能势理论是学习和优化领域相当重要的一套理论和方法。基于......
安全帽是各行各业施工现场工作者和高空作业人员必不可少的一种安全防护工具。进入施工现场前通常要求工人必须佩戴安全帽,但是每......
随着智能设备数量急剧增加,终端用户的计算任务需求远超设备本身计算能力。移动边缘计算架构将服务器资源部署在网络边缘侧,可为终......
互联网的高速发展给人们带来便利的同时也产生了各种安全威胁,传统的网络架构与防御技术存在的确定性、同构性和静态性缺陷,导致了......
强化学习算法是用于解决序贯决策问题的一类算法,与深度学习算法的结合推动了强化学习算法的发展。智能体通过与环境交互,增加对环......
本文主要研究随机环境下连续时间马尔可夫决策过程的最优控制问题.首先我们给出一些条件证明了在有限时间里最优控制策略的存在性;......
Q-Learning是目前一种主流的强化学习算法,但其在随机环境中收敛速度不佳,之前的研究针对Speedy Q-Learning存在的过估计问题进行......
随着控制理论的日益完善,社会生产对于系统的性能以及控制成本提出了更高的要求,最优控制问题受到了越来越广泛的关注。传统的最优......
在未来战争中,传统的单兵种、单装备间的对抗将被多兵种、多装备对抗所取代。协同电子对抗利用计算机及通信技术将现有电子对抗系......
需求响应项目的实施过程中,用户对激励的实际响应程度存在不确定性,导致调整电量无法达到预期效果。为减少电力资源的浪费,优化资源配......
针对大型医用设备人工管理效率低、无法满足应急调度需求的问题,文中提出了基于深度强化学习算法的医用设备应急调度优化技术。使......
自从于2008年问世以来,比特币就作为首个实现完全去中心化的数字加密货币而受到极大的关注。在比特币网络中,所有用户的交易信息都......
随着海上船舶数量的增加和船舶航速的提高,加强船舶航行的安全和安保管理已成为全球各国的当务之急。在海上交通管理任务中,船舶航......
软件定义无线传感器网络(Software-Defined Wireless Sensor Network,SDWSN)基于软件定义网络(Software-Defined Network,SDN)的解决方......
抓取检测作为机器人智能化的研究重点,目的是让机器人能够像人类一样的对外部环境做出判断,抓取各种各样的物体。但传统的抓取检测......
算法作为当今科技高速发展时代下重要的工具,已经深刻影响了经济市场,推动着社会整体资源结构配置的优化。即时配送是互联网下先进算......
在大规模可再生能源并网的趋势下,风电、光伏等间歇性电源出力的不确定性给电网调度运行带来了挑战。传统调度方法通常建立在对不确......
在实际场景中,用户的身份标识符通常是不可用的,例如用户在购买商品前以未登陆的状态来浏览电商平台,或者匿名地浏览网页从而保护个人......
推荐系统致力于从海量数据中为用户寻找并自动推荐有价值的信息和服务,可有效解决信息过载问题,成为大数据时代一种重要的信息技术......
针对相控阵雷达多目标跟踪波束调度和波形参数优化控制的问题,本文提出了一种基于马尔可夫决策过程(MDP)的相控阵雷达跟踪波束调度......
下一代无线通信系统将逐步实现各种无线网络的相互融合,一个重要的研究问题就是如何处理不同网络之间垂直切换。当终端从一个网络改......
随着各种无线接入技术的出现,移动通信系统将发展为由不同无线接入技术共存的异构无线网络,以便为用户提供更多、更好的业务体验。......
随着我国制造业的不断发展,生产设备的先进性和自动化程度逐渐成为企业竞争的一大优势,设备的可靠正常运行是企业利润来源和企业战略......
嵌入式系统的高速发展,使高性能和低功耗的矛盾日益突出,低功耗技术与系统级的电源管理正成为研究的热点。动态电源管理(DPM)是一种......
智能规划是人工智能研究领域近年来发展起来的一个热门分支,由于其广泛的实用性,受到研究者的高度重视。尤其是具有不完全信息和不确......
人工智能一个重要的目标是设计一个智能体使它能够在复杂环境中自主地完成给定的任务,机器学习是人工智能学科的重要组成部分。强......
决策是当前人工智能和机器人领域的关键问题,它的涵义十分广泛,从逻辑推理、专家系统到多主体协作、多主体对策、实时规划、机器学习......
多Agent系统中,Agent之间的协调关系是影响多Agent智能的一个重要方面,协调的目的在于通过信息共享和通信交互,对任务目标、行为动......