论文部分内容阅读
目前基于数据挖掘技术发现石油勘探地质数据(以下简称勘探数据)中隐藏的“知识”并设计自动挖掘软件成为石油石化行业的研究热点。但由于勘探数据的类型多样性和结构复杂性很高,各属性间关系不明确、噪声较大,因此目前业内学者没有比较规范地针对勘探数据的数据挖掘建模过程的研究。另外,国内外已建成大批石油勘探数据库,组成庞大的数据集合,但针对勘探数据的“知识”挖掘软件国内少有。如何对规模庞大、种类多样的勘探数据进行“知识”挖掘以及建立挖掘软件已成为当前石油石化行业谋求长远发展的迫切需要。针对实际情况与目前研究的不足,本文提出一种基于类神经网络的勘探数据“知识”发现方法并实现了该方法的支撑软件。本文从以下三个方面进行研究:(1)以公开的盆地数据(勘探数据的一种)为实验样本,经过数据预处理整理出适合挖掘的数据样本,步骤包括数据清理、数据分析、构造数据。本文以盆地数据为例,详细地说明本文提出的系统化数据预处理过程。这部分研究作为建立“知识”挖掘模型的基础,对于建立高品质的“知识”挖掘模型是必不可少的。(2)根据类神经网络模型理论,以实验为基础探究模型是否适用于本文的盆地数据,同时检验本文提出的数据预处理过程是否适合类神经网络模型。提出针对建立的模型“知识”发现结果的评价标准,并进行评价及分析。(3)根据实际工程需求,本文以适应性类神经网络模糊推理系统模型为基础,提出了以用户需求为主的“知识”发现软件的核心算法。该软件与中国石油某研究院已有的基于SVM模型的“知识”发现软件共同组成石油勘探资源“知识”发现软件系统。本文设计并实现了基于适应性类神经网络模糊推理系统模型的石油勘探资源“知识”发现软件并在实际工程应用中起到较好的效果,软件运行结果表明本文提出的数据挖掘建模过程的理论能够实现。