基于强化学习的认知无线电网络接入技术研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:APIer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
认知无线电技术打破了目前频谱使用固定分配方案的局限性,允许次级用户自适应调整传输参数以利用空闲的频谱资源进行数据传输,大大提高了频谱利用率。得益于对海量通信数据的学习和推理能力,人工智能和机器学习方法能够动态地调整系统的传输协议,以适应复杂的通信和网络环境,代表了未来通信的发展方向。因此利用机器学习解决认知无线电中的问题成为了当下的研究热点。本文对强化学习在频谱感知以及频谱接入中的应用进行了深入的研究。论文的具体工作如下:(1)总结了认知无线电技术的发展历程以及研究现状,重点介绍了频谱感知以及频谱接入的关键技术。概述了强化学习基本模型以及原理,重点研究了Q-learning算法的适用条件、动作值函数的更新公式以及动作选择策略,为后文奠定了理论基础。(2)提出了一种基于DQN(Deep Q Network)的频谱感知算法,该算法将Q-learning算法应用到频谱感知中,考虑到状态空间的连续性,采用神经网络对动作值函数进行近似。同时已有研究表明用户对频谱的占用具有一定的连续性,因此将主用户对频谱的占用建模为泊松过程。为了平衡探索与利用,本文采用一种改进的ε-贪心策略。该贪心策略能够在训练的初期对动作空间进行充分的探索,在训练的中后期更快趋于仅利用。在仿真结果中,我们首先对比不同超参数下算法的性能以选择最佳的超参数,然后将所提算法与现有的其他频谱感知算法进行对比说明了所提算法能够获得更高检验概率。(3)由于存在不完美频谱感知的情况,以及存在多个次级用户进行频谱接入的情况。本文提出了一种基于多智能体强化学习的频谱接入算法,多个智能体之间采用集中控制的方式,动作空间采用联合定义的方式,动作值函数的更新公式与单场景下基本一致。考虑到各个智能体的动作会产生相互作用,我们提出了一种基于博弈论的动作选择策略。仿真结果表明,我们所提的算法能够自主选择空闲概率较高的信道。与已有算法相比,能够提高次级用户系统整体的信道容量同时对主用户系统产生较少的干扰。
其他文献
4-氨基-3-氟苯酚(2)和4-氯-N-甲基吡啶-2-甲酰胺(3)经亲核取代反应制得4-(4-氨基-3-氟苯氧基)-N-甲基吡啶-2-甲酰胺(4);4与4-氯-3-三氟甲基异氰酸苯酯(5)缩合得4-[4-[[[4-氯-3-(三氟甲基)苯基]氨甲酰基]氨基]-3-氟苯氧基]-N-甲基吡啶-2-甲酰胺(6);6再用丙酮/水重结晶制得瑞戈非尼(1),其结构经1H NMR、 13C NMR、 MS(ESI
船舶尾部是船体振动问题最多的区域,主要因为尾部存在密集的振源,包括主辅机、螺旋桨及其轴系等。其中螺旋桨脉动压力所引起的尾部振动一直是船舶振动的关注重点,其减振方法之一是在尾部设置避振穴来减小激振向船体的传递。避振穴可以看作是一个介于螺旋桨和船体结构之间的弹性隔振系统,目前对避振穴的研究多为针对具体船型的改装试验分析,缺少理论和数值方法的研究。本文采用基于橡胶超弹性和空气可压缩性的有限元分析方法,对
近两年市场环境的新变化使社会各个行业进入到新的消费转型期,这促使邮政企业深度思考农产品互联网+销售模式的转型问题,作为国家乡村振兴战略的重要参与者,近年来邮政企业积极通过自身平台和其他第三方平台开展了电商直播助农活动,取得了不错的效果。本文通过对邮政电商农产品市场的现状进行调查分析,寻找电商农产品结合直播带货销售中存在的一些问题,在此基础上构建了消费转型背景下的邮政电商农产品的直播带货营销模式,并
阐述活体内的成像技术,利用这些成像技术,可以直接实时观察标记物体在活体动物体内的活动及反应,探讨基于酶分子的光学成像技术。
研究了粉末PP/EPDM共混型热塑性弹性体的力学性能、热老化性能、压缩永久变形及流变性能。考察了滑石粉及炭黑对共混物性能的影响。结果表明 ,炭黑用量以 2 0份为宜 ,PP/EPDM共混物有较好的压缩永久变形及热老化性能
学位
学位
学位
学位
随着无线传感器网络(Wireless Sensor Networks,WSNs)、5G通信技术、大数据处理技术以及人工智能技术的快速发展,物联网(Internet of thing,IoT)广泛地应用于人类生产生活的各个方面。由于目前IoT设备存在着各种各样的漏洞,导致IoT网络面临着形形色色的恶意攻击和通信过程中的隐私泄露等严峻的安全问题。与Internet相比,IoT具有大规模的设备、多源异构