论文部分内容阅读
数据挖掘在工业领域上呈现出良好的应用前景,同时也存在大量问题亟待解决。石油工业作为工业体系中举足轻重的一环,对其主要勘探手段钻井作业中的安全问题的研究具有十分重要的意义。井漏事故是钻井安全中最为常见的问题之一,传统的人工判定方法依赖于管理人员的经验知识,具有较强的主观性和滞后性。本文基于油田已有的数据资源和专业研究积累,对井漏事故的预警方法进行了研究和分析。本文提出了一种井漏事故的预警方法,能够通过对钻井过程中的实时录井监测数据进行分钟级的分析,以实现及时发现井漏事故的早期征兆,向作业人员发出告警的目的。本文针对工业数据质量差的问题,从综合录井仪采集的在线监测数据和录井观测日志中提取和筛选出可用的数据资源。通过统计分析现有井漏事故相关数据的质量缺陷类型,对原始数据中普遍存在的数据遗漏、噪声和离群值等问题分别进行了处理,全面提升了录井监测数据对于井漏事故预警模型建立的可用性。同时,针对工业数据在字段采集时全面性不佳的问题,本文基于全部录井字段参数进行特征工程,生成了比例均值、比例标准差、钻井工程状态三种特征,并基于特征发散性和特征相关性对原始特征集合进行筛选,最终构造出一个与井漏事故相关性较强的特征子集用于事故预警模型的建立。最后,针对工业数据应用不充分的问题,本文使用极限梯度提升算法充分挖掘和分析了井漏事故和录井监测数据之间可能存在于现有钻井经验知识范畴以外的隐藏关联,建立了井漏事故的预警模型,并提出了一种井漏事故的后续判定方法来对模型的性能进行调节。经实验测试,本文所提出的井漏事故预警模型能够先于人工分辨时间发现疑似井漏事故的迹象,达到了事故预警目的。