复杂系统的模式发现——ε机的理论与应用

来源 :浙江大学电气工程学院 浙江大学 | 被引量 : 0次 | 上传用户:luoboge
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算力学是一个全新的理论框架,主要研究动力学系统中的几何状态空间如何支持符号推理计算。Santa Fe研究所的Crutchfield教授从80年代开始从事这方面的工作。ε机是计算力学体系中的主要理论工具,它的目标在于用尽可能少的人为假设,去揭示系统隐含的固有模式。因此,本文称ε机是一个模式发现的理论。 揭示系统隐含的模式或结构是复杂性研究的重要途径,在ε机理论中,称之为因果态重构。目前,最重要的ε机重构算法是Shalizi在2004年给出的因果态分割重构(CSSR)算法。CSSR算法分为3步:初始化、齐次化、确定化,它以概率统计(如条件概率、KS检验)为工具,能够从平稳的符号序列中推理出系统的因果态。每个因果态都由一系列字符串组成,它们具有相同的变体——条件概率分布。 ε机是复杂性研究中一个颇有价值但十分晦涩的理论,把它引入到工程研究中,是一项有意义的挑战。本文首先从ε机理论抽象出模式发现的思想,并把它同两个不同的问题--异常检测和强化学习相结合,给出了一系列新颖的算法和有意义的结论。其中,异常检测算法更多的表达了“模式”的思想,而强化学习算法更多的体现了“发现”的过程。多个实例分析证明了算法的有效性,同时也证明了ε机理论的客观性和普遍件。我们的工作主要体现在以下一些方面。 异常检测算法包含一个重要假设:系统的特性演变非常缓慢,且体现在时间序列非平稳变化中。它包含两个重要步骤:时间序列的符号化;建立结构向量模型。 CSSR算法只适用用于符号序列,但多数时间序列都是实数的,因此,符号化处理是必需的。统计复杂性是基于ε机的全新的信息测度,可以作为符号化方法的判断标准。本文从多个不同领域选择了8组时间序列作为研究对象,用不同的方法作符号化处理,计算并比较它们的统计复杂性,得到了一系列经验结论。 把系统响应的时间序列做符号化处理,用CSSR算法重构出系统的因果态集合,把它们写成结构向量的形式,每个因果态对应向量的一维。结构向量是系统特性的表达式,它可以刻画系统内部两种不同性质的演变:一是因果态内部的变化;二是因果态的出现或消失。前者是一种量的变化,后者更倾向于质变。在结构向量的基础上定义异常测度,描绘系统的异常演变曲线,因果态的出现或消失会导致曲线的大幅跳跃。这种跃变可以作为系统出现危险的预警信号,它可以在一定程度上取代人为定义的阈值。3个实例:Duffing振子、疲劳断裂、振动时效从不同侧面证明了算法的有效性。半观测马尔可夫决策过程(POMDP)是一个经典的强化学习问题。如果从ε机的角度来分析它,把POMDP问题转变成全观测MlDP问题的过程就是一个模式发现的过程。POMDP中的隐含状态同£机理论中的因果态具有对应关系。为此,在CSSR算法的基础上,提出了隐含状态分割重构(HSSR)算法。在HSSR算法中,观测字符串的变体定义为它周围的观测,并用自定义的齐次性检验取代了KS检验。从Agent走迷宫的实验来看,HSSR算法能帮助Agent有效辨识它在迷宫中所处的位置。 HSSR算法纠正了状态扭曲的问题,把它同Q学习相结合就组成了完整的强化学习算法HSSR-Q。两者的融合存在关键障碍:如何保存并使用Q值。在HSSR-Q算法中,由字符串负责保存并更新Q值,字符串的Q值加权平均得到隐含态的Q值,Agent根据隐含念的Q值来做出决策。HSSR-Q算法实现了隐含状态揭示和动作策略学习的同步进行,并收到了较好的效果。 本义全面而系统的介绍了ε机理论,并把这项复杂系统的研究成果同工程实践紧密结合,做了多方而的研究,得到了全新的算法和结论,同时也体现了ε机理论的工程价值。
其他文献
从上个世纪九十年代以来,脑功能成像技术得到了广泛应用和长足发展。脑功能成像最大的优点就是无损伤,可以直接对人脑进行反复的非侵入性观察测量。 在高级脑功能成像的研究
现今世界上节能和环保正日益受到重视,因此电动车技术的发展步伐正在加快。无刷直流电动机是一种电机、电子一体化的高新技术产品,具有结构简单、运行可靠等优点,在现代工业中应
传统的单纯提供内容服务的Web单页面服务,页面之间没有交互性,而且页面是静态的,而目前典型的电子商业化的Web应用,提供的服务一般都是传统企业的传统业务在网络上的实现,用
迭代学习控制(Iterative Learning Control简称ILC)是智能控制理论的一个重要分支。迭代学习控制适用于那些具有重复运动特性的被控对象,它利用控制系统先前的控制经验,根据系
竖炉焙烧生产过程作为选矿厂整个生产流程中的一个重要环节,其主要任务是将弱磁性的赤铁矿通过高温还原处理转变为强磁性的铁矿石,以满足磁选管回收率(MTRR)、台时产量、煤气消
汉语短语的自动识别一直是自然语言处理领域的研究焦点之一,对信息抽取、问答系统、机器翻译等方面的研究有着十分重要的价值。短语的自动识别是句法分析的一个子问题,句法分
随着经济全球化和Web技术的不断发展,许多大规模管理决策活动已不可能或不便于采用集中方式进行,决策支持面向的对象已经不再仅限于单个决策人或者同一机构的决策群,而是若干
足球机器人是当前机器人研究中的一个热点,足球机器人系统作为一个典型的多智能体协作系统,为机器人学、多智能体系统理论研究和技术应用提供了一个理想的实验平台。作为RoboCu
本文分析了目前国内振动测试系统的发展状况,针对存在的系统功能单一,价格昂贵等局限性,研制出了精度高、体积小、功能强、成本低的便携式测振仪。本文在数据处理中采用ZOOMFFT算法,提高了测量的精度;采用了嵌入式系统的原理创建数据文件存储系统,提高读取速度,节省了单片机RAM的空间;通讯采用USB接口,极大提高了数据传输的速度,并为二次开发提供了良好的基础。最后对样机进行了标定试验,基本满足设计要求。
交通控制是与每个人息息相关的大事,交通流信息采集的准确与否影响着整个城市交通智能化的实现,可以说交通流信息的检测是实现智能交通系统的基石,无论是多么先进的交通系统,都必