基于Hadoop平台的用电行为数据特征挖掘方法

来源 :自动化与仪器仪表 | 被引量 : 0次 | 上传用户:cangxialong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对用户用电行为数据挖掘效率低,规模大的难题,提出了基于Hadoop平台的用电行为数据特征挖掘方法.将用电行为数据按行保存于Hadoop分布式文件系统,把用电行为数据集划分为不同切片产生子数据集,利用MapReduce计算模块对各切片数据进行读取.对k-means方法进行优化,针对初始聚类中心的选择问题,通过数据密度进行处理,结合KL散度,对挖掘得到的用电行为数据进行聚类处理.针对主成分分析方法的弊端进行优化,在进行协方差矩阵特征分解的过程中,可对新到达的电力数据进行增量计算,无需对全部电力数据进行扫描,降低计算复杂度,实现用电行为数据流的特征提取处理.经实例验证,所提方法特征挖掘精度高,可有效分析用电行为数据.
其他文献
不经意间,无数只疯狂点击的黑手,点掉了广告主无数的金钱。愈演愈烈的“点击欺诈”已成为网络广告的梦魇。此时,智驰防恶意点击软件应运而生    金秋十月,北京,欧陆经典大厦A座1507室。  一位儒雅的中年人正在仔细审阅智驰防恶意点击软件的反馈报告,时时会指点着报告向身边的工作人员讲着什么,只听他开心地说道:“看,他们的广告费支出平均节省了55%,这家节省的尤其多,有80%呢!”  研发这款软件的厂家