论文部分内容阅读
随着世界各国智能电网的建设与发展,总体上全球已进入智能电网时代。智能电网实现了电力信息网络广泛互联,也实现了电力用户用电信息的细粒度采集,给人们生活带来便利的同时,也带来了用户隐私泄露风险。利用非侵入式电力负荷监测(NILM)技术,通过分析用户用电数据,可以推测出用户设备的状态,进而推测出用户行为隐私。随着人工智能等新技术快速发展并应用到NILM技术中,隐私分析的准确率与鲁棒性进一步提升,智能电网用户行为隐私泄露风险成为不可忽视的问题。采用传统的隐私保护方法进行智能电网用户行为隐私保护面临一定局限:用户行为隐私难以保证。随着机器学习等先进技术应用到NILM中,攻击者的行为隐私推测能力显著提升,即使用电数据受到一定扰动,攻击者仍然能够正确地推测出用户设备的运行状态,传统的数据扰动机制很难真正奏效。用电数据可用性难以保证。计费等智能电网关键业务依赖于用户的用电信息,这对数据可用性提出了较高的要求。基于密码学的隐私保护方法和中心化差分隐私保护方法均会使数据可用性受到较大影响,并非理想之策。用户侧本地计算资源有限。智能电网用户侧的设备多是智能电表,计算能力相对有限,无法完成大量复杂运算,过于复杂的保护方法无法实际应用。缺少可信第三方支持。智能电网中缺少可信的第三方数据汇聚者,中心化差分隐私保护方法应用受到制约。针对上述问题,本文将智能电网用户分为高敏感度用户和普通用户,分别进行本地化差分隐私保护。针对高敏感度用户需要同时保证隐私性和数据可用性的问题,本文提出一种新的基于隐马尔可夫方法的模型——多输出隐马尔可夫模型(EHMM),并基于多输出隐马尔可夫模型提出了一种随机响应扰动机制。该机制能够在很小的数据可用性损失条件下,有效抵御NILM隐私推测造成的用户行为隐私泄露风险,实现同时保证高敏感度用户的隐私性与数据可用性。本文也优化了用于实现多输出隐马尔可夫模型的正、反向算法、状态估计算法和极大似然估计算法。针对模型训练时间随着训练数据增加而迅速增大的问题,本文提出可以用于EHMM模型更新的迁移学习方法。基于新增的数据,该方法训练产生新的局部模型,再与原有模型进行集成,生成新的全局模型,从而避免了对大量数据进行重复训练,提高了模型的更新速度。针对普通用户本地计算资源相对有限的特点,本文提出基于稀疏编码的本地化差分隐私随机响应机制——SCRAPPOR。该机制利用稀疏编码方法对数据进行编码,然后进行随机响应与数据重构。SCRAPPOR在较少消耗用户本地计算资源的情况下,能够较好地保证智能电网用户行为隐私性与数据可用性。为进一步减少SCRAPPOR中字典生成过程中的本地计算开销,本文提出针对稀疏编码的联邦学习方法。该方法利用多个用户间的协作,将多个用户的本地字典进行汇聚,以较小的计算代价生成更准确的全局字典。针对汇聚过程中收敛慢的问题,本文提出验证加权平均算法,为更好的本地字典分配更大的权重,显著提高了收敛速度。最后,本文考虑字典传输中可能存在的隐私风险,提出相应的隐私保护方法。通过理论分析与实验证明表明,在智能电网环境中,本文方法能够取得针对NILM隐私分析的良好保护效果,使高敏感度用户与普通用户实现满足本地化差分隐私的用户行为隐私保护。