基于机器学习的LTE-U网络资源优化

来源 :浙江大学 | 被引量 : 0次 | 上传用户:liuandhll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动通信技术和移动通信设备的发展,人们对于高速率低延时的通信需求越来越大,这给移动通信带来了巨大的挑战和压力。为了应对许可频段资源短缺造成的移动通信系统容量有限、数据传输速率增长有限的现状,学术界和工业界提出了两类解决方案,其一是提高许可频段的频谱资源利用率,其二是将LTE技术引入免许可频段,即LTE-U技术。由于许可频段资源的稀缺性,第一类方案的提升始终有限,相比之下由于免许可频段频带更宽也更空闲,可以显著增加蜂窝移动通信系统的系统容量和数据传输速率,因此LTE-U技术有着广阔的应用前景。然而,LTE-U技术的应用仍面临许多挑战,其中最主要的难题是LTE与WiFi的共存问题,因为LTE-U系统的MAC层采用和LTE系统一样的免竞争的协议,如果不加以控制和管理,LTE-U系统将在免许可频段上对已在此频段上工作的网络设备,特别是应用最广泛的WiFi网络产生严重的影响,使其性能严重恶化。因此能否解决LTE与WiFi的共存问题是LTE-U技术能否成功应用的关键。尽管LTE与WiFi的共存问题已经得到了深入的研究,但大多数研究工作局限于中心式场景,然而在许多场景中,比如小蜂窝网络和WiFi网络密集部署的场景,中心控制节点并不存在,因此这些方案并不实用。为了解决分布式场景中LTE和WiFi的共存问题,本文提出利用机器学习算法,尤其是强化学习算法使得小基站能够通过与环境交互自适应地学习最优决策。不仅限于分布式场景,我们还研究了机器学习算法在中心式场景中的应用,以克服传统方法的一些局限性。本文首先将具有代表性的深度Q值网络学习算法应用于分布式共存系统中的LTE和WiFi共存问题。为了确保WiFi系统和LTE系统之间的公平性以及LTE系统中各小基站之间的公平性,我们提出了一个max-min形式的免许可频段资源分配问题。由于该问题本质上是一种多人博弈,我们将其重新描述为一个合作式博弈问题,并应用多智能体深度Q值网络学习算法使每个小基站可以自适应地学习最优的资源分配决策。为了使算法能更快更好地收敛到纯策略纳什均衡,我们提出了一种特殊的Q学习规则。仿真结果表明我们提出的算法可以快速地收敛到最优纯策略纳什均衡并获得和最优中心式算法一样的性能。其次,我们在第一个工作点的基础上将问题扩展为一个长期的免许可频段资源分配和用户关联问题。我们的目标是最大化LTE系统的长期平均每用户吞吐量,同时保证不同接入技术和不同小基站之间的长期公平性。类似地,我们将问题重新建模为一种非合作式博弈。考虑到问题的时序性,我们提出了一种基于双向长短时记忆网络和策略梯度法的深度强化学习算法,令每个小基站通过与环境交互自适应地学习均衡的混合策略。仿真结果显示我们所提的算法可以收敛到混合策略纳什均衡。此外,仿真结果还表明相比类似于第一个工作点的短期免许可频段资源分配,长期的免许可频段资源分配和用户关联可以通过学习WiFi网络的负载变化规律从而充分利用WiFi网络的空闲时段资源以进一步提高LTE系统的平均吞吐量。最后,我们研究了中心式场景中机器学习算法的一种应用。为了提高LTE-U系统的全局能量效率,我们考虑联合优化资源分配、用户关联和基站睡眠。我们的目标优化问题是一个复杂的混合整数分式规划问题。首先我们通过Dinkelbach算法化分式为减式,然后利用变量替换将原问题转变为标准的混合整数凸规划问题。我们可以利用标准的分支定界法获得混合整数凸规划问题的最优解。然而,由于分支定界法的时间复杂度在最坏情况下是指数,这种复杂度通常是无法被接受的。由于分支定界法的复杂度主要来自其剪枝策略,为了在获得近乎最优的解的同时大大降低分支定界法的时间复杂度,我们基于模仿学习提出了一种剪枝策略学习算法来学习分支定界法的最优剪枝策略。仿真结果表明我们的算法可以大大加速分支定界过程,同时在性能上远胜于一般的启发式算法。
其他文献
"一唱三叹”,指一个人歌唱,三个人跟着相和,源于远古民歌,后成为诗歌的重要表现手法。在小学语文习作中“一唱三叹”教学范式主张教师抓住小学语文教材中一个单元里最关键的
在日常生活中,中风发病常常会引起人们不同程度的运动性障碍,使得部分患者丧失了基本的活动能力,患者为了较快速的恢复,往往忽视了肌肉的疲劳程度而进行长时间或高强度的康复训练,引起了一些负面效果,更甚是危害生命安全。所以,患者需要寻求合理的、有效的治疗方式来帮助自己恢复身体健康。传统的康复或简单的医疗设备已不能满足用户对健康的需求,因此研制新的智能辅助设备对患者进行实时监控并科学地制定康复计划有着广阔的
吸毒贩毒现象之泛滥,始于70年代的美国。此后短短10余年,毒品活动从种植、加工、贩运到消费,已形成一个完整的国际分工体系。产毒、吸毒、贩毒相互刺激,恶性循环,使毒品经济
信息技术的发展为人们的生产生活带来了极大的便利。随着信息交流便利性的提升,数字版权意识也得到了发展,印刷品作为信息交流的重要媒介,其对于信息安全的需求与日俱增,尤其
核桃作为世界上重要的干果之一,既是非常重要的油料资源,又是经常食用的营养保健果品。新疆素有“瓜果之乡”的美誉,新疆核桃壳薄、仁香、品质上乘,享誉国内外,成为中国核桃
社会化是学校教育的重要功能,在当前的学校教育中出现了以角色化取代社会化的倾向,忽视了学生承担社会角色的多样性,严重影响学生的身心发展,不符合社会发展的需要。
时评复兴的重要原因在于新闻传播者在与"他人"所联结的体系的交往中自我意识的觉醒。时评复兴不仅仅是一种体裁的复兴,更是新闻评论理念的回归。时评以标志性的名称宣告当代
只要群众点赞,再苦再累都心甘。一个基层民警,没有丰功伟绩,却能让社区居民把他当成贴心人;没有豪言壮语,却肯不顾辛劳,十年如一日扎根基层、默默奉献。他说,群众满意就是我
一、“饲料盐”能改善饲料的适口性,增强食欲,帮助营养物质的消化吸收,提高饲料利用率。它是家畜、家禽饲料中重要的矿物质,是维持生命活动必不可少的物质。1.能维持血液和组织液