论文部分内容阅读
随着国家水资源开发的深入,我国建设了一大批具有国际领先水平的大坝,水库大坝具有防洪、供水、灌溉、发电等多种社会经济效益。然而,水库大坝产生的巨大势能也对下游人民生命财产安全构成极大威胁。大坝安全监测的主要目的是掌握大坝的运行特性和各项监测措施的变化趋势。为了对工程安全性进行评价,如何快速、准确地从海量监测数据库中提取有用的信息,成为很有价值的研究课题。本文以某土石坝的实际监测数据为样本,利用聚类集成的方法模型统计分析监测点信息,筛选异常监测点数据,方便进一步研究大坝面板的形变规律。(1)通常大坝面板环境传感器是根据不同水位线布置的,本文为了更加充分和及时地利用丰富的监测信息,针对大坝安全监测数据中的数据分布,在传统谱聚类算法基础上,引入基于约束的半监督学习方法。基于样本的先验知识(样本之间的约束条件)构建样本点约束矩阵,适当地运用约束信息ML(必连集合)和CL(勿连集合)一定程度上改善了聚类效果。(2)约束谱聚类算法的聚类精度会随着约束对的增加而提高,但和传统聚类算法一样,其聚类效果同样受限于数据样本的局部密度影响。为了克服这一缺点,在上述研究的基础上,借鉴共享近邻和自然邻的思想,根据局部密度较适应地调整数据点之间的相似性。本文提出了一种适用于大坝面板监测的基于改进约束谱聚类方法。该方法利用自然邻产生的自然特征值与共享近邻结合,对相似度矩阵重新定义,使其对参数不再敏感,有效发掘大坝面板监测数据集中的类簇结构。(3)考虑历史大坝安全监测异常数据点分布特征,根据数据点的密度特性优化初始聚类中心点的选择。通过基于聚类中心最大距离和密度优先原则的优化K均值算法设计基聚类生成器,同时引入集成分析策略,以改进约束谱聚类算法作为一致性函数整合基聚类结果,设计基于聚类集成的大坝异常数据检测模型。该方法模型可以避免算法陷入局部最优解,减少算法迭代次数,提高聚类质量和异常检测效率。以大坝面板监测数据为研究对象,形成实验数据集,进一步验证了基于聚类集成的异常数据检测模型能够高效地处理多尺度数据集的聚类问题,在检测精度和效率方面优于传统的基于聚类的异常检测方法。