论文部分内容阅读
我国煤炭资源丰富,占世界煤炭总量的13%。长期以来,煤炭一直是我国的主要能源之一。这种以煤炭为主的传统能源结构模式短期内不会有所改变,预计到2050年,煤炭将占我国一次能源生产和消费的50%以上。煤炭开采的安全问题关乎民生,一直是国家高度重视的问题,然而我国煤矿的水文地质条件复杂,且随着煤炭开采强度和深度的日益增大,煤炭地质的灾害性问题严重威胁安全生产。在瓦斯、水害、顶板、火灾、粉尘这五大矿难中,矿井突水仅次于瓦斯事故居第二,发生频率相对较高,且危害严重。快速、准确判识突水水源是预防突水事故的关键。煤矿识别突水水源的最常用方法是常规水化学识别。计算机技术和数学地质的发展为突水水源识别提供了排除“干扰”和定量化的手段。近年来,在分析研究常规水化学指标的基础上进行突水水源识别的计算机算法和研究很多。但是,这些算法在实际的矿井突水水源快速判识中存有以下问题:1.判别指标适用性差。矿井突水水源判别指标一般采用地下水八大常规离子,忽略了不同矿区,同一矿区不同矿井的水文地质条件不同和水文地质条件日趋复杂的现状。2.离散化过程降低速度和精度。当前应用于矿井突水水源识别的属性约简算法只适用于处理离散数据。处理连续数据时,需对连续数据离散化,这必然产生信息损失,降低准确性和判识速度。3.大数据处理能力较弱。实时监测带来大数据,高维数据常常引发“维数灾难”。4.通用性研究有待深入。传统的基于机器学习的矿井突水水源识别算法适用于对大量的样本数据进行处理分析。然而,在矿井突水问题中,有时获取大量训练样本数据是困难的。5.安全性有待提升。地方煤矿与相关矿务局等单位之间需要进行矿井突水水源的数据传输,矿井突水水源在线识别、预警系统需要实时传输海量数据,这些必然带来数据读取和传输过程中的信息安全问题。针对上述问题,论文以陈四楼煤矿不同含水层水源特征和矿井突水水源识别算法为研究对象,提出了两种快速判识矿井突水水源的算法,并保障了数据的安全性。论文的主要研究成果和结论如下:1.深入研究归一化Cheeger cut、图p-Laplacian、邻域粗糙集、属性约简、谱聚类理论的基础上,提出了一种新的邻域粗糙近似的归一化Cheeger Cut聚类算法(NRA-NCC),用于快速、准确判识矿井突水水源。该算法通过四方面的处理解决了当前矿井突水水源判识指标适用性差、离散化过程降低维度与精度、大数据处理能力弱的问题。它们分别是:(1)增加水源判识指标,提高判识全面性和适用性。(2)基于邻域粗糙集进行属性约简,避免连续数据离散化,提高矿井突水水源的判识速度。(3)将信息熵引入属性约简,提高矿井突水水源判识的准确度。(4)提出NRA-NCC算法进行聚类,能够处理矿井实时采集的高维水源数据。实验表明,NRA-NCC算法优于传统的Normalized Cut聚类和归一化Cheeger Cut聚类算法,对高维数据具有较强的抗干扰能力和良好的泛化能力。基于NRA-NCC建立的矿井突水水源快速判识模型能够很好地处理矿井实时采集的海量水源信息,聚类精度高。2.提出了一种基于特征重要度的随机森林矿井突水水源判识方法,实现快速准确判识矿井突水水源的目的。该算法适用于分析和处理少量和存有缺失项的矿井突水水源数据。传统的基于机器学习的矿井突水水源判识算法适用于对大量的样本数据进行处理分析。然而,在矿井突水问题中,获取大量训练样本数据是困难的。论文结合陈四楼煤矿的现实状况,提出了一种基于特征重要参数的随机森林矿井突水水源快速判识算法。该算法在训练样本匮乏时,仍能快速,准确地判识突水水源,并能保持较高的准确率,且不容易产生过拟合。3.矿井水害问题日益突出的现状对矿井突水水源的快速判识提出了更高的技术要求。本研究依托的“十二五”国家科技支撑计划项目“矿井突水重大灾害实时监测预警系统”是基于互联网的矿井突水水源类型辨识信息处理的新方法新理论。矿井突水水源数据在实时判识、远程分析、云计算平台处理和分布式计算等过程中都会涉及到信息安全问题,此方面的研究目前还相对较少。论文通过分析现有身份认证机制缺陷,基于Wang等人的方案提出了一种使用数字签名的零知识证明的匿名身份认证算法,并对该协议的安全性和计算效率进行了实验验证,该算法既降低了矿井突水预测、预警系统数据传输的通信流量又具有更高级别的安全性。