论文部分内容阅读
人们在对大量的数据进行分析的过程中经常发现一些异常的观测值,这些观测值可能蕴含着大量有用的信息。因此,异常点的探测和分析是一个有趣而重要的数据挖掘任务。
异常点在数据分析中很常见,非线性时间序列分析也不例外,异常点对于模型的确立有着重要的影响。本文章主要是对门限自回归模型(TAR)的估计、异常点位置及其大小的确定。在探测异常点的时候我们使用了迭代方法。它的主要思想是先估计出TAR.模型,然后在此模型的基础上分别判断每一时刻出现异常点的可能性,紧接着利用消除异常点影响后的观测值重新估计TAR模型,如此迭代直至不出现异常点为止。
这里遗传算法被引入用来估计TAR模型的门限,选择算子按照达尔文的适者生存的机制进行选择,交叉和变异算子由基因的变异和染色体的组合引入。为了使算法每一步的最优解不被破坏,本文使用最优保留策略;为了增加群体的多样性同时抑制早熟现象本文采用可变的变异算子。这里充分运用了遗传算法是一种全局优化概率搜索算法的特性。
最后将我们的方法应用于几组模拟数据以证明我们方法对于探测异常点的类型位置和大小是有效的。