论文部分内容阅读
开展电力行业市场化改革十余年后的今天,供电企业面临着外部市场和内部管理的综合压力。随着2017年北京市电力公司实现智能电表在全市范围内的“全覆盖、全采集”,智能电表的普及使得对居民购用电信息和数据的实时采集成为可能。海量数据使得电力营销服务管理开始迈入大数据时代,利用海量数据和数据挖掘技术对居民的购电行为做出分析和预测是提升供电企业竞争力的关键。因此有必要针对居民购电行为的特征和变化进行研究,为供电企业的业务管理提供参考。本文的主要研究内容如下:首先,基于客户行为分析理论以及数据挖掘在电力行业和其它领域的广泛应用,对数据挖掘的目的和步骤做了简要分析。基于对居民购电流程的分析,从牵涉到居民购电的一体化平台、售电管理系统、营销管理系统和采集下发系统四个数据库中提取出了反映居民属性和购电行为属性的字段,并对这些字段进行了梳理和约简。其次,考虑居民地区分布和用电分阶的情况下,采用分层混合抽样从全市130多万个智能表居民户中抽取了 8000户居民,以这些居民2013年至2017年的购电记录作为分析样本。抽样完成后,对抽样数据进行了预处理,包括去除数据的重复值、去除数据的无效值和对空白数据进行添补。然后,对分析用到的多个字段按其所代表的含义进行了分类,分为购电维度、时间维度、地理维度和属性维度四个维度。通过多维度的分析,得到了居民在购电时间、购电金额、购电笔数、购电渠道以及购电方式的选择等多个角度的变化情况,全面了解了购电的规律以及不同地区或不同用电水平在购电时所呈现出来的差异性,并根据居民购电行为的变化对购电公司内部的优化提出了参考意见。最后,利用K-means聚类算法,选取购电金额和购电次数两个聚类特征,对2016年和2017年的居民进行了聚类,很好的将居民分为了 5类,有利于供电公司根据这四类居民不同的购电习惯进行业务上的分析和渠道上的管理。定义并编程计算出了居民的购电渠道偏好和购电方式偏好,采用2016年和2017年的数据构建马尔科夫转移矩阵,预测了 2018年至2020年间三种渠道偏好型居民的占比。选择居民的聚类类别、用电分阶和地区类别作为挖掘前项,购电方式、购电渠道等作为挖掘后项,采用Apriori关联算法得出了居民属性和购电行为间的关联关系。