基于强化学习的Ad Hoc网络QoS路由算法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:haofan555888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Ad Hoc网络(MANETs,Mobile Ad Hoc Networks)是一种由无线移动节点组成的具有任意性和临时性网络拓扑的动态自组织网络系统。随着应用领域的不断扩展,要求Ad Hoc网络能够针对不同多媒体业务提供不同的服务质量QoS(Quality of service)。特别是目前日益增多的音频、视频和高实时性的数据业务都对网络传输平均延迟、延迟抖动、优先级划分、带宽分配等提出了更高的要求。本文在总结前人研究工作的基础上,对利用强化学习算法求解移动Ad Hoc网络QoS路由问题进行了系统而深入的研究,主要做了以下三方面工作。1.在分析现有Ad Hoc路由算法链路模型的基础上,针对现有路由算法的链路模型基本为二值模型,也就是链路要么是断开,要么是连接,这种模型不能有效区分是由于拥塞引起的链路失败,还是由于目标不在传输范围内引起的传输失败这一问题,本文将离散链路模型改进为基于统计值的连续链路模型,并结合改进Q学习算法,提出了基于改进统计链路模型的Ad Hoc网络强化学习路由算法SNLQ。根据802.11MAC协议的特点,利用统计度量信息来表示链路的质量,有效解决了强化学习路由算法链路表示问题,也为强化学习算法的动作选择提供更准确的信息。仿真实验表明,该算法可以有效解决拥塞频率和端到端延时,其性能优于AODV与DSR。2.本文通过研究多约束QoS路由的数学模型,结合改进的SARSA强化学习算法,提出了应用SARSA强化学习算法来求解移动Ad Hoc网络中多约束QoS路由问题,并提出相应算法SARSA-R,该算法考虑了链路带宽和延迟两种QoS指标,仿真实验证明了该算法对于解决多约束QoS路由问题具有较好的性能。3.以NS2网络仿真器为仿真平台,设计了一个融合SNLQ和SARSA-R的仿真系统。仿真结果表明,本文提出的算法充分利用了Ad Hoc网络有限的带宽,减少了平均端到端传输延迟,而且接收端视频的主客观质量评价都有了明显提高。
其他文献
视觉媒体包含着丰富的信息,而且现在已经广泛渗入人们的生活与工作当中,并对人们的生理和心理产生着潜移默化的影响。因此,视觉媒体与用户情绪反应之间的分析和建模研究已成
近年来,随着图像处理应用越来越广泛和深入,其对图像质量的要求也越来越高,对高分辨率图像的需求也越来越大,图像超分辨率一直以来都是计算机科学研究的热点。而由于物理器件
现今的并行编程实践多采用锁来同步对共享资源的访问,编程难且易出错;新引入的原子区构造虽简化了编程,但支持其实现的软硬件技术尚不令人满意。本文就同步提出一种新的语言
对于主观题自动评分问题,国外的研究已经达到了一定的成熟程度。研究人员开发了一些基于自然语言处理(natural language processing,NLP)技术的实用的评分系统,并提出了一些基于
近年来随着信息技术特别是网络和多媒体技术的发展,电子学档受到了广泛的关注。但是到目前为止,在网络学习环境下很少有成型的电子学档应用于教学实践中,也没有把电子学档的应用
软件复用是近年来国内外软件界研究的热点之一,它能大幅度提高软件质量和生产率,降低软件开发和维护的成本。而如何有效地检索到用户所需要的软件构件是实现软件复用的一项关
由于计算机硬件的元器件、集成度、工艺和体系结构的发展几乎到了极限,因此,并行处理技术成为提高计算机性能的重要手段。并行程序设计和并行编译技术是并行处理技术的关键,
无线传感器网络是二十一世纪最重要的技术之一,它是把物理世界与数字世界联系起来的纽带,以此为基础的物联网应用呈现出发展的态势。由于传感器节点易失效性,大规模传感器网
2003年,Sattam S.Al-Riyami和Kenneth G.PatersonSattam首次提出了无证书公钥密码学这一新概念。与传统公钥密码学和基于身份密码学相比,无证书公钥密码学主要有两方面的优点
rCOS是A Refinement Calculus for Object Systems(对象系统的精化演算)的简称。它以统一程序设计理论(Unifying Theories of Programming) [3]为基础,是一种面向对象的描述