满足节点差分隐私的图数据发布与分析

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:bobo20092009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图数据作为社交网络数据的重要存储模式,在网络分析、数据挖掘等方面发挥着重要作用。图中的三角形是研究社交网络模型的重要角色,通过三角形,分析者可以识别出社交网络中有着重要地位的角色,可以发现小团体网络结构,可以区分出垃圾邮件的主人。因此,直接发布图中的三角形信息会带来用户隐私的泄露问题。针对图上三角计算这一重要参数的隐私泄露问题,节点差分隐私保护技术基于其严格的数据理论证明,可以有效地保护图上任一节点的隐私信息不被披露,在保证隐私性的同时保留了数据的可用性,完善了发布数据的安全性。直接发布满足节点差分隐私的三角计算相关数据信息,会带来极大的噪声量,在大规模的图数据上这种噪声量会使得加噪后的数据可用性变得极差,而适当的删除不必要的连边,将节点三角个数控制在设定的阈值参数内则可有效地控制噪声量的大小,大大降低满足差分隐私所需要添加的噪声量,从而在发布数据的隐私性和可用性之间取得最优的平衡。基于该删边预处理模式下,对节点三角计算的累积发布比非累积发布效果更好。同时,针对节点本地聚类系数,在三角计算的发布基础上,通过将聚类系数先分组再查询的方法,差分隐私保护技术也可以实现很好的发布效果。实验表明,在发布三角计算结果时,不同的阈值设定对应不同的数据集有着不同的发布效果,小数据集对应低阈值而大数据集对应高阈值可以在保留更多原数据集信息的基础上取得最好发布效果。在发布分组后的非累积节点本地聚类系数结果时,阈值参数影响着发布效果,而分组参数影响着原始图特征的保留程度,实验证明,分组越多,可观察的统计信息越多,而阈值越高,隐私性越高,与此同时噪声量越大,发布的效果越差。因此,不同的数据集对应着不同的参数选择策略,合适的参数能够在保证隐私性的同时保证最优的发布效果。
其他文献
目前所使用的种子发芽方法有常规发芽法和快速发芽法。常规发芽法的特点是准确,但所需时间较长。而快速发芽法可以在30~35℃的温度下,做各种作物种子的发芽试验,且省时、准确,
目的了解哈尔滨市儿童流感流行特征,为制定儿童流感防治策略提供科学依据。方法采集儿童流感样病例的鼻咽拭子标本,采用MDCK细胞培养法分离流感病毒,微量血凝抑制(HI)实验进
丰富的想象力在钢琴演奏过程中占据着非常重要的地位,具体到当前的高校钢琴教育之中,不论是对教师的教学而言,还是对学生的钢琴演奏学习而言,学生的想象力都有着十分重要的意
尿潴留是产科常见的并发症之一,影响子宫收缩,导致阴道出血量增多,给产妇带来痛苦,是造成泌尿道感染的重要因素。因此,我们对2005年1月至2006年12月在本院分娩、剖腹产的尿潴
为了观察苏木乙酸乙酯提取物对溃疡性结肠炎(ulcerative colitis,UC)大鼠T淋巴细胞亚群的影响,试验采用兔黏膜免疫法造模,将Wistar大鼠随机分成正常对照组、模型组、苏木低剂
慢性心力衰竭(CHF)是各种心血管疾病发展的终末阶段,是导致心脏病患者死亡最主要的原因。近年来有研究表明,血清胱抑素C与心功能水平和心室重构密切相关,可能是慢性心力衰竭
为了研究驾驶疲劳对道路交通流运行状态的影响,提出了一种改进的一维元胞自动机交通流模型.在周期性边界条件下,通过分析驾驶员的疲劳特性,考虑驾驶疲劳对驾驶员驾驶行为的影响,分
随着羽毛球的普及,羽毛球进入高校的体育课堂,成为大学生喜爱的体育活动项目,本文以大量的文献资料为理论基础,通过问卷调查、数据统计等方法。对我校羽毛球课的教学现状进行了分
本文主要论述了一种网络专题资源的新型组织形式——“活动链”式网络资源的开发。“活动链”式网络资源是以提高学习者的探究能力为目标,以一系列的探究活动为线索,将相关的专
本科毕业论文(设计)是对学生四年学习成果、创新能力和自身素质的综合检验,也是对学校及教师教学质量全面、综合的检查。文章通过构建毕业论文(设计)质量评价模型,并运用层次分析