基于最大策略熵深度强化学习的通信干扰资源分配方法

来源 :西北工业大学学报 | 被引量 : 0次 | 上传用户:parisjiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对通信组网对抗中干扰资源分配的优化问题,提出了一种基于最大策略熵深度强化学习(MPEDRL)的干扰资源分配方法.该方法将深度强化学习思想引入到通信对抗干扰资源分配领域,并通过加入最大策略熵准则且自适应调整熵系数,以增强策略探索性加速收敛至全局最优.该方法将干扰资源分配建模为马尔可夫决策过程,通过建立干扰策略网络输出分配方案,构建剪枝孪生结构的干扰效果评估网络完成方案效能评估,以策略熵最大化和累积干扰效能最大化为目标训练策略网络和评估网络,决策干扰资源最优分配方案.仿真结果表明,所提出的方法能有效解决组网对抗中的干扰资源分配问题,且相比于已有的深度强化学习方法具有学习速度更快,训练过程波动性更小等优点,干扰效能高出DDP G方法15%.
其他文献
目前有关堆的取证研究主要是针对Linux系统的堆和Windows系统的NT堆,然而怎样从转储文件中提取出Windows 10系统段堆信息并没有得到充分研究.为了重现Windows 10系统中段堆的内部信息,提出根据内存对象vtype描述信息中字段偏移定位并解析段堆内部信息的方法.使用池扫描技术定位进程对象,根据进程对象和进程环境块对象的结构信息获取进程堆的起始位置并扫描进程堆,再使用段堆特征值定位段堆的位置,进而提取出段堆的内部信息.依据分析结果,研发了基于Volatility框架的5个段堆取证插件.实验
参照《中国城市轨道交通智慧城轨发展纲要》中智慧车站示范工程建设内容及目标,文章在分析相关业务需求、技术难点的基础上,提出构建区域站点集中值守和远郊车站无人值守模式的具体解决方案.通过研发站区协同管理系统、智能客服支持系统,配置智能可穿戴设备,改造生产系统,实现中心站值班员集中管理区域各卫星站,线网线上客服中心替代线下各车站客服中心,场景化预案和日常业务直接通过岗位终端在线化和数字化,致力于智慧车站建设成果的价值输出和组织模式技术适配.相关成果可为其他城市开展智慧车站建设提供参考和借鉴.
基于传统自适应积分法(AIM)提出了一种阵列自适应积分法,用于高效处理有限周期阵列和稀疏阵列的散射计算问题.该方法利用5层托普利兹(Toeplitz)矩阵技术解决了传统自适应积分法中冗余栅格点问题,并在此基础上利用零值屏蔽技术来消除远场对近场的干扰,省去近场矫正步骤.该方法还采用块状雅克比预处理来提升迭代求解效率,并使用波程差补偿技术加快远场后处理.仿真结果表明,该方法具有良好的计算精度,计算时间和内存消耗远小于传统AIM,并且不仅适用于有限周期阵列,也能仿真稀疏阵列的散射特性.
通过对比碳纤维复合材料与传统金属材料电导率、介电常数及磁导率等电气特性参数的差异,分析碳纤维复合材料替代传统金属材料用于制造轨道车辆车体结构给电磁兼容设计带来的问题.针对轨道车辆整车电磁兼容技术要求,结合典型运营工况,从复合材料建模、整车电磁仿真、车体接地网设计和复合材料电搭接设计等方面,阐述碳纤维复合材料轨道车辆的电磁兼容设计思路和要点,以助于碳纤维复合材料在轨道车辆领域的推广和应用.
为有效辅助工业设计师进行文化创意产品配色设计,输出符合用户意象偏好的配色方案,提出了群体共识驱动的文化创意产品交互式配色设计方法.利用三角模糊数对用户群体的意象偏好进行量化描述,构建了群体意象偏好共识度模型,研究了交互式遗传配色设计的流程和基本原理,通过基于三角模糊数的群体一致性决策进行文化创意产品配色种群的交互式遗传进化操作,生成满足群体共识意象偏好与满意度的配色方案,通过色彩美度计算对最终方案进行优选.以兵马俑钥匙扣挂件形象配色设计为例,验证了所提方法能够有效融合群体用户的意象偏好,通过多用户决策一致
北京大兴机场线是全国首条运营速度160 k m/h的城市轨道交通线路,轮轨力检测采用高速铁路相关的控制标准,但经过现场应用及深入分析发现,轮轨垂向力控制标准对于大兴机场线过于宽松,不能全面有效地发现不同程度的轨道病害.为做好线路养护工作,文章基于大兴机场线轮轨力检测的相关数据分析,提出大兴机场线轮轨垂向力控制标准,该标准可有效发现线路不同程度的病害,为列车安全运行及线路养护管理提供科学指导.
近年来,随着城镇化进程的加快,我国逐步形成一批具有“一心多组团”空间结构特点的城市,即组团式城市.组团式城市的一体化发展需要高品质、高速度、大容量的城市轨道交通体系作为支撑.文章以组团式城市泰州市为例,通过剖析其城市空间结构、人口分布和居民出行特征,并对城市轨道交通线网规模、线网布局等规划要点进行分析,提出“C形主骨架+加密/辐射线”的线网规划方案,以期为组团式城市轨道交通线网规划提供参考和借鉴.
高压旋喷加固法被广泛应用于基坑底被动区软弱土层加固工程中,是控制基坑变形非常有效的技术处理措施.以杭州地铁基坑工程为例,综合分析杭州地铁工程坑内高压旋喷加固的施工经验,总结出适合杭州地铁软弱地层的设计施工关键技术参数建议值.通过数据整理,主要就土层含水量、龄期2个关键指标对加固体抗压强度的影响敏感度进行分析,找出相对变化规律;加固体抗压强度随加固龄期的增长而不断增大,随土层含水量的增加而减小,不同龄期的变化趋势基本相同.
2020年以来,国内各大城市进入市域轨道交通的快速发展期,市域轨道交通的功能定位、客流特征、最高速度、运营组织、车型选择等逐渐成为业内人士关注的问题,其研究方法与铁路、城市轨道交通类似,但仍存在一定差别,尚无统一的研究模式可参照.文章通过剖析市域轨道交通的功能定位、客流特征、车站分布、时间目标、最高速度、车辆制式、网络互联互通、线路敷设方式等技术特征,并对技术特征之间的关系进行抽丝剥茧,得出一种市域轨道交通车型选择方法.通过南京都市圈相关市域轨道交通线路的验证与分析可知,该方法思路清晰,具有较好的可行性和
发展了一套能够耦合非定常舰船流场的直升机飞行动力学模型.采用DES方法以获得高精度非定常舰船流场,并基于“单向耦合”思想构建了CFD向飞行力学模型的数据传递策略.以SFS2舰船模型和UH?60A直升机组合为研究对象,从直升机操纵余量和非定常载荷水平两方面分析了着舰过程中舰艉流场对常规单旋翼直升机的扰动特征.时均研究结果显示:对于右旋旋翼直升机,在右侧风情形下飞行员能够具有更多的总距操纵余量,但由于尾桨受侧洗流的影响,脚蹬余量相较于0°风向角情形会大幅降低.非定常水平结果表明:侧风情形下舰艉流场湍流脉动强度