社会网络数据发布的局部差分隐私保护方法

来源 :广西师范大学 | 被引量 : 1次 | 上传用户:DDD1968
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的逐渐普及,人们的社交方式也从传统模式逐步发展到线上平台交流,夜以继日的新用户增加使得各类线上社交平台产生出越来越多的社会网络数据。社会网络数据除了能够带来巨大的商业利益外,对其特定结构以及各种存在模式的数据分析也普遍被应用于舆情分析、群体活动等各个方面。然而,新的技术手段为我们的日常生活带来极大便利的同时也暴露出这种便捷所存在的问题。社会网络数据往往包含有大量的个人敏感信息,发布这些网络数据更会对个人隐私带来严重的威胁。围绕社会网络数据所做的隐私保护问题已经成为隐私保护领域的一大研究热点。首先,基于局部扰动以及k-匿名的社会网络数据发布隐私保护方法,只能抵御特定的攻击类型,对于数据攻击者的背景知识需要严格的假设。这种隐私保护模型只针对某一特定类型的攻击者生效,隐私保护的强度不足。其次,目前已有的基于差分隐私的社会网络数据发布方法,大多是结合生成图模型抽样生成的方式重构原始网络,并在重构过程中添加噪声,从而实现差分隐私数据发布。这种数据发布隐私保护方法,对于社会网络的结构信息是具有破坏性的。然而,在社会网络分析中社会网络结构信息是十分有价值的,例如普遍存在于社会网络中的社区结构等,对进一步挖掘出子群用户的行为、属性信息等起到重要的作用。因此,在社会网络隐私保护数据发布方法能够抵御各种类型攻击的同时,保护社会网络的拓扑结构的研究是十分必要的。本文针对带有结构信息的社会网络问题,提出采用基于局部差分隐私的噪声扰动策略设计隐私保护方法实现数据发布,具体内容如下:(1)分析了现有全局化差分隐私模型对社会网络结构信息破坏性较大的问题,提出两方面原因:一方面,全局化的差分隐私保护方法对攻击者的背景知识是不符合现实意义的;另一方面,现有方法中网络用户个体间的连接关系仅以布尔变量简单表示,在注入差分隐私噪声时,会对单个边添加过多的噪声,从而影响图的流通性。(2)针对破坏社会网络数据结构信息的两方面原因,提出局部差分隐私的社会网络数据发布隐私保护方法(Local Differentially Privacy for Social Network publishing based on Uncertain Graph)。从两方面解决了现有方法对社会网络的结构信息破坏较大的问题:一方面,设定了更具有现实意义的社会网络数据发布隐私保护场景;另一方面,结合生成图模型,对带有社区结构的社会网络局部边概率重构并注入拉普拉斯噪声。(3)针对提出的局部差分隐私的社会网络数据发布隐私保护方法(LDP-USN),以严密的数学公式,证明了该方法是满足局部差分隐私的。并在三个真实数据集上具体设计、实现了该算法。构建了该方法的系统框架,同时对各个功能子模块以及各个模块的算法流程进行了详细的描述。最后分析了三个主要算法的时间复杂度。(4)通过三个真实的社会网络数据集(WebKB、Cora、Citation)的仿真实验,结合常用的社会网络结构属性检测标准,本文选取在不通隐私预算下的聚集系数(Clustering coefficient)、结构熵(Structure entropy)以及边数三个性能指标来验证本方法的结构保护程度。结果显示,在三个数据集上平均聚集系数与原始图相比较为接近,并随着隐私预算的逐渐变大,聚集系数与原始图数据越接近;结构熵在隐私预算?≥0.2时,与原始图较为接近;边数在较为稀疏的数据集WebKB中,与原始图相比较少,但在另两个数据集中,随着隐私预算的逐渐增大,边数与原始图逐渐接近。本文通过实验与原始社会网络进行对比,分析了本方法在网络结构保护方面的性能,验证了所提出的方法的有效性。在一定程度上保护了社会网络数据的结构信息同时,能为发布的社会网络数据提供有效的隐私保护。
其他文献
云计算、大数据等新型网络正推动着IT行业的变革,但同时也暴露出许多安全隐患。云安全问题已成为制约云计算发展的最大障碍,如何通过访问控制来保护云环境中信息安全是本文的
随着我国经济社会的迅速发展,以及人们生活水平的逐步提高,人们对保险的需求也在不断的扩大,对我国的商业保险行业的发展起到了非常大的促进作用。随着我国保险行业的快速发展,保险代理市场也逐渐的成熟了起来,在保险代理市场的发展过程中,由于对客户资源的争夺越来越激烈,保险公司与各类保险代理机构之间的矛盾也越来越深,在为保险专业代理市场的发展带来巨大隐患的同时,也对保障客户的利益造成了非常大的危害,因此保险专
超分辨率重构是指从一幅或一系列低分辨率图像通过数字图像处理的方法重建出一幅高分辨率图像的技术,该技术不仅能够增加图像的高频信息,也可消除低分辨率成像过程中产生的退
目前,人工智能快速发展,深度学习亦随之崛起,尤其是在机器学习和模式识别等领域。卷积神经网络(Convolutional neural network,CNN)结构简单,鲁棒性好,适应性强,其优异的性能
在对实际系统建模的过程中,常存在多种不确定性,比如模型误差,测量误差等,通常将其称为未建模动态.它的存在严重影响着系统的动态性能,甚至会破坏系统稳定性.消除或抑制未建
近年来,由于控制科学、计算机科学、通信工程等领域交汇融合的发展,多智能体系统协调跟踪控制研究引起了学术界和工程界的不断关注,随着研究的不断深入,有关多智能体系统协调
在水污染日益严重的背景下,为实现科学准确地治理已污染水体以及保护未污染的水资源,必须进行有效的水质检测工作,从而全面掌握水污染状况,为水资源保护提供依据和指导。目前,用于指示水体有机污染程度的常规检测指标主要包括化学需氧量(COD)和生化需氧量(BOD)。本文在前人的研究基础之上探讨了一种COD和BOD的一体化测定技术。通过活性污泥曝气降解有机物污染物的方式考察了BOD测定过程,采用控制变量的单因
随着云计算技术的兴起,云平台上的计算资源和存储资源应用的越来越普及,基于这种新型系统架构,云计算提高了应用系统的可扩展性和高可用性;其业务模型能够满足企业降低成本、
在传统的数据分类中,通常需要挖掘区分能力较高的频繁序列作为分类依据,从而为用户提供潜在的高价值信息。近年来,随着不确定数据处理需求的快速增长,挖掘不确定数据集上的区
清末新式学生群体是由传统走向现代的第一批学生群体,也是五四新学生乃至当代学生的雏形。近代对中国影响较深的人才,究其源头,大都是由清末新式学生成长起来的。本文以湖南新式学生为切入点,从近代区域学生史、教育史的角度,对清末湖南新式学生群体的产生背景、发展概况、与社会变革的关系,进行了较为全面的论述。清末湖南新式学生群体是在民族危机加深、民族资本主义初步发展、新式教育改革的背景下诞生的,他们主要是一批接