论文部分内容阅读
仿真数据分析是有目的地收集仿真数据、分析仿真数据,使之成为信息或知识的过程,是为更好的理解和改进系统而进行的,是仿真领域研究的重点问题。由于现有的仿真数据分析方法中,缺乏能够有效处理大规模、高维数、相互关系复杂的复杂仿真数据的方法,因此本文将数据挖掘技术应用于仿真数据分析中,采用了一种基于支持向量机理论的预测建模分析方法,为大范围方案寻优及数据趋势预测等问题提供了解决方案。本文具体研究工作包括以下内容:分析了目前仿真数据分析工作中存在的难点。跟踪了仿真数据分析方法的国内外研究现状,并概述了数据挖掘的任务、发展历程与研究进展,继而给出了本文的主要研究内容。在对比了仿真实验与传统实验的差别的基础上,分析了仿真系统实验对仿真数据分析的需求。从仿真数据特征入手,分析了仿真数据具有数据量大、维度高、样本少及不确定性强的特征。这些特征使传统的基于统计的数据分析方法难以有效进行数据分析。针对上述问题,采用了两种数据预处理方法用以解决不同的数据分析需求:属性约减方法——解决了高维数据难以分析的问题和异常数据检测方法——解决了异常值影响回归模型可信度的问题。在研究了传统数据分析方法可能存在的问题的基础上,对基于数据挖掘的仿真数据分析方法的关键技术进行了深入的研究。以支持向量机理论为核心方法对仿真数据进行预测建模分析,分别将分类、回归模型应用于实际仿真系统中,在很大程度上解决了大范围内方案寻优及数据趋势预测两大任务难以实现的问题。实现了预测模型参数的优化算法。基于交叉验证的思想,在分别采用网格划分方法与遗传算法进行参数优化后,对比了两种算法的优化结果,分析了两种算法的不足之处。在此基础上,提出了将两种算法混合应用的组合优化算法,解决了网格划分方法大范围优化运算速度慢的问题与遗传算法优化结果可能存在“过学习”的问题。