基于强化学习的量子系统控制研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:zhaijiayue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
量子系统控制的设计被认为是建立强大量子信息技术所需的关键任务,而在实际的应用中,量子系统的控制实验经常会面临不同的限制条件。对于一类控制资源有限的量子系统控制任务,本文提出利用强化学习算法解决该类问题。此外,从优化强化学习算法角度,本文提出了情绪强化学习并将其应用于量子系统控制问题中。针对基于现有强化学习算法解决量子系统控制问题,本文将待解决的量子控制任务建模为强化学习可优化解决的问题,其中根据可选择的酉操作数量的不同定义了两种控制方法:三开关控制和Bang-Bang控制。然后利用经典的强化学习算法学得令人满意的控制策略使得量子系统能够从初始态演化控制到目标态。本文设计了仿真实验,即在两种控制方法下分别利用Q学习、概率Q学习和量子强化学习算法验证了强化学习算法对于解决量子系统控制问题的有效性。针对利用新算法解决量子系统控制问题,首先,本文给出优化传统强化学习方法,即基于情绪理论设计强化学习奖励函数,提出了一种情绪强化学习算法。相比传统强化学习算法,新算法注重智能体的学习过程信息,允许智能体具备反思学习能力。然后,新算法与传统强化学习算法在迷宫环境下进行实验对比,实验结果表明新算法可以加速学习效率。最后,本文将提出的情绪强化学习算法应用于量子系统控制问题中,仿真实验表明在两种控制方法下该算法能够实现对量子系统的控制,展现了其在量子系统控制问题研究中的应用价值。
其他文献
人力资本提升是保障减贫效果可持续性的关键。已有文献多是在家庭人力资本结构同质化的假设前提下估计健康和教育为内涵的人力资本存量的减贫效应,较少关注于家庭人力资本结
中国自古以来就追求“真、善、美”,重情重义,因而有“道德之邦”的美誉。但随着社会进入转型期,行为失范、道德缺失、个人主义、功利主义等问题的出现引起了全社会的关注与
大气重力波是大气在重力和浮力的共同作用下产生的一种波动,作为大气能量和动量传输的载体,对中高层大气循环、气候和空间天气均有重要影响。当大气重力波向上传播通过中高层
近年来我国很多露天矿外排土场排土空间严重不足,所以只能进行内排,将所挖的土方进行堆积处理形成堆积体边坡。边坡破坏是一个动态的,多尺度的破坏过程,涉及到从微孔洞的损伤
滚动轴承是机械设备中的关键零件,也是设备中最容易发生故障的部位,对滚动轴承进行故障诊断的研究具有重要的研究意义。数字化工厂的快速发展,使数据的获取方式变得更加丰富,
三维、准三维的表面顺形电子是最近年来继可拉伸电子之后在柔性电子制造方面出现的一个新的方向。针对准三维表面顺形电子成型过程中出现的电路翘曲、断裂和电路图案映射困难等问题,重点应用图像处理探究了薄膜在准三维表面模型上成型前后的映射关系,同时围绕制造工艺的特点设计并搭建了制造设备,并开发了相应的人机交互界面。本文主要内容包括:1.对本课题制造工艺的流程进行介绍和分析,根据工艺的需求和特征设计、建模并组装
生成对抗网络(Generative Adversarial Networks,GAN)是一种无监督生成式模型,包括生成网络和判别网络两部分.GAN经常面临模式崩溃,梯度消失和梯度爆炸等问题,而且训练较为困
高密度电阻率法在工程物探中是一种十分理想的方法,其效率高,数据丰富,勘探能力强。传统的二维高密度电法相对与三维高密度电阻法而言,传统二维方法,电阻率的变化只在沿测线
目的:本研究拟通过哮喘控制测试(Asthma Control Test)评分、肺功能指标、中医证候评分进行综合分析及评估,从而研究应用益气固卫法下内外合治肺脾气虚型的咳嗽变异性哮喘患者的临床疗效。方法:本研究方案采用前瞻性随机对照试验的方法,于广州市中医医院呼吸科门诊就诊的病人中符合肺脾气虚型的咳嗽变异性哮喘者随机抽样得72例病患,根据随机数字表法将入选患者分成试验组和对照组各36例。对照组采用沙
结构决定着功能,林分密度是影响林分结构、稳定性及其功能的关键指标。为从水土保持功能角度探索刺槐人工林适宜密度问题,本文以山西吉县蔡家川流域内的刺槐人工林为研究对象,采用野外调查与室内试验的方式,对475、900、1200、1575、1825、2350株/hm2六种不同密度刺槐林的涵养水源、保育土壤、生物多样性保护、理水减沙功能进行研究,并运用Topsis评价方法对刺槐林水土保持功能做出综合评价,旨