论文部分内容阅读
在生产生活中,可以收集到许多数据,为了更好的了解这些数据背后的数学、物理意义,可以使用符号回归的方法对这些数据进行拟合。符号回归是根据给定的数据集,在指定的符号空间内搜索能够拟合数据集的公式。符号回归是NP-hard问题,其主要使用遗传编程算法(Genetic Programming-GP)进行求解。由于GP算法有搜索方向随机和不能够保存历史搜索结果等缺点,导致其搜索效率低并且容易陷入局部最优。为了克服以上缺点,本文将深度学习的方法引入到符号回归问题中。深度学习可以发掘出数据中的隐藏特征,以指导公式的“生成”过程。针对于无系数的符号回归问题提出了一种基于卷积神经网络的符号回归算法(CNN-SR)。首先使用卷积神经网络学习公式的“生成”特征,再依据所给目标数据集使用神经网络还原出目标公式。实验结果证明,CNN-SR算法可以比GP算法更快速高效的找到目标公式。为了解决带有系数的符号回归问题,提出了一种基于蒙特卡洛树搜索的符号回归算法(MCTS-SR)。MCTS-SR算法将符号空间划分为模型空间和系数空间;然后,在深度策略网络指导下通过蒙特卡洛树搜索实现在模型空间内寻找适合数据集特征的公式模型;在此基础上,使用粒子群算法搜索公式模型下的系数空间,以得到适应度最优的公式。实验结果证明,与GP算法相比,该算法具有适应度值更低、不易陷入局部最优的特点。为了减少MCTS-SR算法中训练数据集中存在的人为干涉因素,并且可以动态改变训练数据集,提出了一种基于强化学习的符号回归算法(RL-SR)。RL-SR算法使用强化学习中DQN算法对神经网络进行训练。与传统的有监督训练相比,RL-SR算法一次可以训练一整条路径的公式生成过程,并且可以在训练过程中添加训练数据。实验结果证明,与GP算法相比,RL-SR算法得到的公式适应度值更低。