论文部分内容阅读
地震是一种破坏性极大的自然灾害,每年给全世界造成重大的经济损失和人员伤亡,因此对地震进行预测具有十分重要的意义。但是由于地球的不可入性、大地震的不频发性、地震成因的复杂性等导致地震预测异常困难。地震预测的三要素是时间、震中心位置和震级大小,其中常固定三要素中的时间和地点,对某个震级范围内的地震是否发生进行预测,可将其抽象为一个分类问题。其主要研究方向分为基于前兆数据的地震预测和基于历史数据的地震预测。由于历史数据完整性好、可靠性高,本文将选用基于历史地震数据的地震预测作为研究方向。尽管目前地震预测取得了一定成果,但仍存在以下问题。由于地震的成因复杂,不同时间不同地点发生的地震,其主要影响因素可能存在差异,故描述不同地震的特征指标也不尽相同。但大多数方法对所有地震数据均采用相同的特征指标表述导致特征指标代表性不强,预测效果较差。同时由于地震数据尤其是大地震数据较少,需要大量异常数据进行训练的监督式机器学习方法容易陷入局部最优,出现过拟合问题。针对以上两个问题,本文从生物免疫系统的高自适应性和高特异性中受到启发,借鉴其中的特异性、记忆性和克隆选择机制建立地震预测模型。借鉴特异性机制和记忆性机制,为每一类地震数据选择最佳特征子集和预测子模型组合处理,同时记录已处理过的地震数据与最佳预测子模型组合间的对应关系。当有相同类型的地震数据输入时采用相同的预测子模型组合处理,以解决特征指标代表性不强的问题。借鉴克隆选择机制,采用克隆选择算法对每一类地震数据的预测子模型组合进行调优,在全局寻找最佳预测子模型组合,避免陷入局部最优。基于以上生物免疫学的启发,本文提出基于特异性免疫机制的地震预测模型。模型主要分为三部分:预处理阶段、初次免疫应答阶段和二次免疫应答阶段。预处理阶段首先采用八个经典特征指标计算地震特征指标数据,之后对特征集进行分割,经过数据映射建立特征子集数据矩阵。初次免疫应答阶段先建立免疫细胞池,然后激活免疫细胞,通过克隆选择优化免疫细胞组合,并形成免疫记忆。二次免疫应答阶段首先匹配记忆B细胞,然后激活记忆B细胞对抗原进行处理。最后本文使用四川省的历史地震数据作为样本,对未来一个月内是否发生4.5级及以上的地震进行预测,使用检测概率、误报率、准确率、R得分、ROC曲线和ROC曲线下面积作为评价指标对预测效果进行评估,并将实验结果与地震预测的主流方法神经网络进行对比。实验结果表明,本文算法在准确率和R得分上均优于神经网络方法。