【摘 要】
:
近年来,复杂动态系统的控制器的设计已成为一个越来越重要和具有挑战性的问题,并且已经取得了很多重要的研究成果。本文提出一种基于学习人类策略的智能控制方法,建立系统状
论文部分内容阅读
近年来,复杂动态系统的控制器的设计已成为一个越来越重要和具有挑战性的问题,并且已经取得了很多重要的研究成果。本文提出一种基于学习人类策略的智能控制方法,建立系统状态与人类专家控制量之间的关系。通过采集系统的状态信息和人类专家的控制信息作为训练样本,然后利用支持向量机(Support Vector Machine, SVM)对这种关系进行训练学习获得学习控制器。由于不同的训练样本会训练出不同的控制器,我们希望能够对得到的控制器进行一定地分析,从中选取性能较优的控制器。利用SVM训练得到的控制器是一个典型的非线性系统,我们首先给出了判定该系统在扰动下是否稳定的充要条件。对于局部稳定的系统,吸引域的大小能够反映出系统的抗干扰的能力。本文采用Sum of Squares (SOS)方法估计其吸引域。针对利用SOS方法估计吸引域中遇到的双线性问题,本文提出了两种迭代的求解算法并用实例验证了算法的正确性。为了验证前面提出的控制方法和稳定性分析方法,我们将这些方法应用于实际的系统独轮机器人Gyrover中,来实现对独轮机器人的自动平衡控制。通过采集人类专家控制Gyrover保持平衡时的实时数据,训练得到控制器。实验仿真结果验证了学习人类专家策略方法的有效性。我们对训练出的控制器进行了吸引域分析,仿真结果显示吸引域越大的系统抗干扰性能越强。
其他文献
校园是人群密集的特殊场所,对于各类公共危机具有较高的敏感性。无论是社会公共危机还是学校内部的突发危机事件,都会不同程度干扰学校的正常教学秩序和生活秩序,严重时会危及学
张从正的攻邪论,针对滥施温补的时弊,深化了中医对邪气致病及攻邪治病的认识,扩大了汗、吐、下法的内涵,为后世留下了丰富的经验,尤其是吐法的经验弥足珍贵。
自1993年9月至1998年6月,笔者以镇肝熄风汤为基本方,配合静脉滴注脉络宁,治疗中风先兆50例,疗效满意,报道如下。1 临床资料50例中,男32例,女18例;年龄最小47岁,最大66岁,平
针对反后坐装置测试性差、故障知识匮乏等难题;将虚拟样机作为一种新的定量推理机制引入故障仿真与知识获取领域;以某新型自行火炮反后坐装置为研究对象,在Pro/E和MSC.ADAMS
风荷载对于高层建筑结构的安全性和舒适性十分重要。随着建筑高度不断增加,风荷载权重逐渐超过地震荷载成为最受关注的荷载。然而直接从自然风荷载特性出发来计算结构的风致响
为了使单片机系统可靠运行 ,必须对单片机系统进行可靠性设计 ,为此 ,提出了单片机系统可靠性设计的思想 ,并从硬件和软件两个方面探讨了单片机系统可靠性设计的技术途径。根
目的研究心理、癌痛及并发症预防的综合护理模式在早期癌症化疗中的应用价值。方法 70例肿瘤住院患者,随机分为观察组和对照组,各35例。观察组采取综合护理,对照组采取常规护
针对云南小湾电站采用GPS开发高边坡远程自动化变形监测系统中海量GPS原码信息采集与传输问题,从安全监测系统的可靠性以及成本考虑,选择了无线公网GPRS通讯方式,并通过自定
<正>茶,一千多年来就是中国人重要的饮品之一,从事茶叶买卖的人数占全国总人口的比例高达9%,所以每年都有数量庞大的茶商为茶叶生意辛勤忙碌,为茶市时刻鏊战着。而中秋、国庆