基于强化学习的蜂窝网频谱规划和D2D系统资源管理

被引量 : 4次 | 上传用户:kdkd03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
资源分配问题的研究一直都是移动通信系统中的核心问题之一,这是由于无线资源匮乏的本质因素决定的。随着移动通信技术的高速发展、各类智能终端的大量涌现,用户的业务需求和业务类型日益丰富和多元化,业务对于移动通信系统的服务质量和传输速率的要求不断提高。所以如何合理有效地利用有限的无线资源,提供高速的数据传输,来满足用户各类业务的需求,成为未来移动通信系统需要考虑的主要问题和目标。本文主要研究的是将一种智能的方法——强化学习引入到无线资源管理问题中,以便动态有效地解决无线资源分配问题。本文对强化学习的基本原理、常用的强化学习算法以及无线资源管理的相关内容进行了详细的描述和介绍,为强化学习在无线资源管理中的应用打好了理论基础。本文重点研究了应用强化学习解决移动蜂窝网络中的无线资源分配问题,提出了如下两种应用场景。首先,对LTE系统小区间的下行资源分配,在部分频率复用方案的基础上,针对小区间边缘负载分布不均衡的情况,提出了一种不同于固定频率复用因子的基于梯度强化学习联结网络的动态频率复用方案。通过仿真验证,本文所提的方案能够更好地适应小区边缘的负载分布,降低了小区边缘用户的不满意度概率,提高了边缘用户的平均吞吐量。其次,在引入D2D通信技术的蜂窝系统中,对于正交和非正交两种不同的资源共享方式,提出了不同于传统瞬时的资源分配方法。将D2D蜂窝系统建模成马尔科夫环境,用户的业务到达服从泊松过程。利用强化学习中的Q学习算法,找到时间序列上的最优的资源分配策略。仿真表明,在正交的资源共享方式下,采用Q学习能够获得更大的全局累积效用,并且更好的满足了优先级较高的蜂窝网用户的需求;在非正交的资源共享方式下,采用Q学习的方法则能够获得更大的系统容量。
其他文献
LDPC码是由它的奇偶校验矩阵完全确定的线性分组码,LDPC码最初是在上世纪60年代由Gallager在他的博士论文中提出,此后很长一段时间由于缺乏可行的高效译码算法,一直被人们忽
有线电视系统中前端机房是信号源与传输系统之间的桥梁,它不仅是信号源与传输系统之间双向交流信息的传递者,还是系统实现各种控制功能的管理者。前端机房所处的位置和功能决
表面等离子体激元(SPPs),是一种存在于金属和介质交界面的电磁波,SPPs可以将电磁场限制在金属表面,从而产生强烈的场增强效果。近年来,SPPs的研究大多数集中在光学波段,然而S
混沌信号是一种特殊的类噪声信号,其呈现天然的宽带特性,因此采用混沌信号的混沌雷达有着许多无可比拟的优势,如分辨率高、功率谱平坦、截获概率低、抗干扰能力强等优点。但
在电信这个服务型行业中。企业为了在竞争激烈的市场中生存发展,客户关系管理工作的质量显得尤为重要,客户流失预测是客户关系管理中最基础也是最为关键的部分。然而在实践中
经皮冠状动脉腔内成形术(percutaneous transluminal coronary angioplasty,PTCA)是临床广泛应用的一种冠心病介入疗法。手术中支架尺寸和置入方式的选择以及支架的准确定位对于
压缩感知(CS)理论指出,信号可以低于奈奎斯特速率进行采样。采样频率可以不受信号最高频率的限制,而只与信号自身的结构相关。信号在满足变换域是稀疏的或信号是可压缩的条件下,就
无线资源管理(Radio Resource Management,RRM)是对移动通信系统中有限的无线资源进行合理分配和有效管理,使用户性能和系统容量达到联合最佳状态。在第三代合作伙伴组织(3rd
无线紫外光通信是一种新型的无线光通信技术,以其传输信息的保密性高、抗干扰能力强、非直视通信、适用于特殊的通信场合和全天候工作等优点能满足在复杂地理和电磁环境下的
作为智能视频监控的重点学科之一,视频目标跟踪涉及了计算机技术、信号处理、模式识别以及计算机视觉领域等重要学科,有着诸如人机交互、医疗诊断、交通管制、视频监控等方面