论文部分内容阅读
随着可穿戴设备的快速发展和应用,越来越多的用户数据被记录和采集,这些数据包含了大量的个人敏感信息,在给用户提供了丰富的个性化服务同时也增加了人们对于隐私信息泄露的担忧。而基于科学研究、数据共享等目的,为了充分挖掘可穿戴设备数据的价值,很多数据拥有者需要对数据进行发布,如何保证可穿戴设备数据发布过程中的隐私保护是目前研究的热点问题之一。论文首先对可穿戴设备的发展和隐私保护技术的相关知识进行了介绍,在此基础上重点研究了可穿戴设备的数据发布隐私保护过程,并针对变长的最大距离平均向量(Variable-Maximum Distance Average Vector,VMDAV)算法存在的若干问题进行改进,提出了基于权重W和属性的敏感度参数S的WSV-MDAV算法,并以此为基础结合差分隐私提出了新的数据发布隐私保护模型。论文主要工作如下:(1)提出了基于权重W的个性化距离度量(Weight based Personalized Distance Measurement,W-PDM)。传统的微聚集算法中,主要针对准标识符属性包含多种数据类型的情况进行研究,且计算过程默认所有属性权重相同。本文不仅考虑到不同使用者的个性化需求,还考虑到每个准标识符属性的数据分布对该属性隐私泄露的影响,通过对不同准标识符属性设置不同的权重,可以更好地体现属性的重要程度,更有效地衡量记录间的距离以及微聚集算法的同质性。(2)提出了敏感属性值的敏感度参数S。针对V-MDAV等微聚集算法可能受到同质性攻击或相似性攻击导致敏感属性泄露的问题,将(α,k)匿名模型的思想引入到变长微聚集算法V-MDAV中,并针对不同的敏感属性值设置不同的敏感度参数,比原来的(α,k)模型更加灵活,使算法对敏感属性值的保护更好。(3)以WSV-MDAV算法为基础,提出了新的数据发布隐私保护模型:差分隐私可穿戴数据发布模型。该模型先通过WSV-MDAV微聚集算法对数据表进行处理,随后将差分隐私引入到数据发布过程中。一方面差分隐私优势在于不需要考虑攻击者的背景知识,弥补了基于微聚集等基于分组的模型的缺陷;另一方面,要达到差分隐私需要对数据添加噪声,而经过微聚集处理的数据敏感度降低,需要添加的噪声减少。论文随之对提出的模型和算法进行了仿真分析与比较,仿真结果表明本文提出的模型和算法与V-MDAV相比,提高了隐私保护性能,减少了信息损失,可以较好地实现可穿戴设备数据发布的隐私保护。最后论文对研究成果进行了总结,指出了研究过程存在的问题并对未来可穿戴设备的隐私保护技术进行了展望。