【摘 要】
:
为了对电网设备档案数据中无法提炼错误规则的数据问题进行自动诊断,提高数据质量,文章利用大数据机器学习技术,运用机器学习算法,对数据进行自动检测;基于Spark分布式内存计
论文部分内容阅读
为了对电网设备档案数据中无法提炼错误规则的数据问题进行自动诊断,提高数据质量,文章利用大数据机器学习技术,运用机器学习算法,对数据进行自动检测;基于Spark分布式内存计算,利用K-Means聚类算法对档案数据进行聚类训练,再对训练后数据进行分析和处理。试验证明,基于本方法论形成的自动诊断工具能够大幅降低在数据治理工作中的人力投入,减少工作量,降低工作成本,并且可以获得比人力筛查更详细更准确的结果。
其他文献
摘 要:该文利用1985-2009年数据,建立城乡收入差距对居民消费需求的回归方程,结果表明城乡收入差距对居民消费需求产生负影响,并且存在一定的滞后效应,说明我国政府应注重收入分配政策的长远战略,以及应采取措施缩小城乡收入差距,以免对经济增长产生制约作用。 关键词:居民消费率;泰尔指数 一、问题描述 受国际金融危机影响,我国经济下行压力加大,扩大内需尤其是扩大居民消费需求对保持经济增长的
轴承的摩擦力矩影响到能量损耗、温度、噪声、振动的变化、仪表动作的准确性等.本文介绍了影响轴承摩擦力矩的因素以及一些常用的摩擦力矩测量方法和测量仪器.
目的探讨西门子炫速双源CT冠状动脉成像在心脏病诊断中的应用价值。方法于本院2017年2月至2018年2月接收的心脏病患者中选取73例作为研究对象,均行西门子炫速双源CT检查,检查
实验研究了N-甲基二乙醇胺(MDEA)和乙醇胺(MEA)混合有机胺水溶液吸收煤气中H2S和CO2的过程。采用严格的混合溶剂电解质理论建立了气体吸收的热力学计算模型,并用模拟计算软件(ASPEN
学校体育教育的改革应以人为本,要重视学生个性的发展,要适应时代的变化要求,要向终身体育过渡。高校实施体育选项课教学,遵循了大学生身心发展规律和兴趣爱好,适应了高校体育教学
本节课的内容是小学阶段“图形与几何”中有关立体图形知识的整理与复习。通过复习所学立体图形的特征,比较和沟通有关立体图形之间的联系与区别,使学生巩固和深入理解小学阶
介绍了GKD1A型机车主电路接地故障的排查方法,对及时消除接地故障、保护机车主电路上的牵引电机等重要设备、确保机车安全运行具有重要意义。
透过慈善机构的现状,发现慈善事业的潜在性问题,针对这些问题进行分析,从而为慈善事业的发展指明方向,提出合理性的建议,使慈善事业更加健康的发展。