论文部分内容阅读
自适应中间件框架一般根据预先定义的策略、按照监控、分析、决策、执行的流程实现对开放可变系统的闭环控制.但是,传统的自适应框架基于离线的闭环控制,即在提供自适应服务的同时,自身的决策模型不能随实时的环境变化而更新.针对该问题提出一种基于强化学习的自适应中间件的在线更新方案,解决自适应策略的冲突消解、系统实时效用评估问题,并设计一种基于强化学习的自适应策略在线学习更新方法,增强了自适应中间件的智能性、灵活性和应变能力.最后实现了相应的支撑系统OUSAM并在其上验证了该机制的有效性和可行性.