论文部分内容阅读
由于D2D通信技术在提升频谱效率、减少传输时延、降低终端能耗等方面的优势,一直以来都被广泛研究,尤其是针对D2D用户与蜂窝用户共存的网络,如何通过优化资源配置等方案实现网络系统各方面性能的提升是主要研究方向。但这种传统的D2D通信中,D2D设备传输所用资源都是与蜂窝用户共享,没有专用的D2D通信资源池,且传统D2D通信对于业务时延的考虑不多。未来通信网络中,超高可靠低时延场景对于D2D业务时延的满足非常看重,且引入了sidelink的概念专用于此类D2D通信,本文针对这种sidelink-D2D通信展开资源配置方面的研究。sidelink-D2D通信现有的资源配置模式有两种,分别为基站调度资源的模式Mode 1及D2D设备自选资源的模式Mode 2,前者能够有效保证D2D通信的传输可靠性,但信令交互带来的时延比较高,无法满足低时延D2D业务的时延需求;后者能够节省信令开销及调度时延,但自发竞争资源可能导致传输可靠性的降低。针对这一情况,本文提出一种自适应的D2D资源配置模式切换方案,允许D2D设备根据业务时延需求及当前PSSCH资源池的拥塞程度进行资源配置模式的自主切换,以便确保其时延需求及传输可靠性。为了支持本方案,文中还定义了一种新的PUCCH上行控制信息,用于D2D设备发送资源配置模式切换请求。对于Mode 1、Mode 2及本文所提资源配置方案,文中也分别从理论上分析了各自的D2D通信业务时延,并仿真表明了本方案在满足D2D业务时延需求方面的有效性。基于强化学习中的Q学习算法,对本文所提方案进行进一步优化,将sidelink-D2D网络作为学习环境,将资源配置模式的切换与否作为动作空间,将Mode 1或Mode 2两种资源配置模式作为状态空间,综合考虑D2D业务的时延需求与优先级,对满足业务时延的传输给予相应奖赏值,通过不断的学习和探索,优化本方案在sidelink-D2D通信资源配置中的性能。仿真表明,结合Q学习算法的本方案,能在D2D用户强度增大时依然保有平稳的业务时延需求满足率,对于高可靠、低时延、海量设备接入的D2D通信场景有较好的适用性。