论文部分内容阅读
社会经济的全面快速发展,推动了人们对于电力行业的需求,同时以窃电为主的异常用电行为事件的发生次数也在逐年攀升,使得电力公司承受了巨大的经济损失,也给国家电网的安全运行造成了一定的安全隐患。传统的防异常用电手段主要以人工稽查的方式为主,会消耗巨大的人力和物力成本,且无法做到实时准确地定位异常用电的电力用户。近年来,智能电网和信息化技术在不断地发展,实现了电网电力负荷数据及时地收集和存储,为用户异常用电行为研究提供了海量数据,同时机器学习、深度学习等技术也在不断发展中日益成熟,为数据分析工作提供了有效的技术支撑。为辅助电网公司进行用户异常用电行为的稽查工作,本文深入研究和分析了电力用户异常用电行为,提出了一种基于深度循环神经网络(Deep Recurrent Neural Network,DRNN)和Wassertein距离的生成对抗网络(Generative Adversarial Networks,GAN)的数据增强技术——DRNN-WGAN模型,以解决电力负荷样本不平衡问题;研究了一种基于Light GBM(Light Gradient Boosting Machine)集成学习模型和逻辑斯蒂回归模型(Logistic Regression,LR)的异常用电行为检测识别方法——Light GBM-LR模型,以解决异常用电行为高检出率的识别问题。(1)分析电力负荷数据。先对数据进行了清洗工作,包括异常值剔除、缺失值填充和重复数据去重等操作;然后针对电力负荷数据的规律进行特征工程,主要是周期性提取统计性特征和趋势性特征;最后对负荷数据进行了降维和归一化处理。(2)分析数据不平衡对于机器学习模型分类准确率的影响,提出了一种DRNNWGAN模型。利用生成对抗网络模型中生成模型和判别模型进行二元零和博弈,以生成和其异常用电样本具有同分布和相似特性的异常用电样本,通过深度循环神经网络加强GAN网络中对时序特征的提取能力;通过Wassertein距离改进GAN网络,加快模型的收敛速度,解决模型不够稳定,难以训练的问题;并通过对比过采样、欠采样等其他数据增强方法,验证了该模型的有效性。(3)基于数据增强后的均衡数据集,研究了现有的集成学习方法,提出了一种基于Light GBM-LR模型的电力用户异常用电行为检测模型,基于网格搜索和随机搜索方法确定Light GBM集成学习的超参数,将该模型与其他分类模型进行对比,验证了该模型具有较高的识别能力,将该模型与多种集成学习模型进行异常用电行为识别效果对比,验证该模型在集成学习方法中的优越性。