论文部分内容阅读
随着Web2.0的快速发展和3G网络技术的普及,手机上网用户数量的增加,社交类型的网站迎来了快速发展的最佳时期,比如朋友网、SNS、微博客等。在这些社交网站上注册的用户数量非常多,且用户的自主性、互动性更高,用户就会自然地成为信息的制作者、传播者或者共享者,社会网络数据就会非常庞大。由于科学研究与实际应用的需要,数据拥有者需要将社会网络数据进行公开发布。另外,社交类型网站大量创建并营造一个非常有应用价值的市场环境,很多基于社会网络统计分析的技术方法被开发研究并在商业领域产生了广泛的应用,出现新式社会网络数据挖掘技术并产生了经济价值。但如果不合理地使用这些数据,会对用户的隐私和信息安全构成威胁。传统的隐私保护技术不能直接应用于维度更高的社会网络数据,且其本身就具有复杂性,同时也缺少相应的隐私保护方法,导致用户的隐私信息泄漏。而数据发布者要保证拟发布的数据不能泄露个人的重要敏感信息,发布者必须对待发布的数据进行匿名化处理。数据结构中的相关图理论与方法被用来表示社会网络数据,提出一种基于k-同构算法优化改进的社会网络隐私保护方法,通过对原始图数据进行有效划分为k个子图,同时为降低匿名成本,增加与删除边数量近似相等,保证发布的图数据是k-同构的,使得攻击者不能利用背景知识发动结构化攻击。针对动态社会网络数据发布中泄露个人的隐私信息问题,同时对于攻击者的多重联结结构化攻击,采用动态社会网络隐私保护方法,在每次发布时采用k-同构算法把原始图有效划分为k个同构子图,然后对节点ID泛化,阻止节点增加或删除时攻击者结合多重发布间的关联识别用户的隐私信息。算法主要分为两部分,第一部分得到k-同构匿名的社会网络,即k个同构子图彼此间是同构的;第二部分对动态社会网络中节点的ID进行泛化。对于非动态的社会网络,直接进行k-同构处理;对于动态的社会网络,首先进行k-同构处理,然后对节点ID进行泛化,再发布匿名社会网络。最后,对提出改进的优化算法进行性能测试,采用真实数据集进行实验。结果表明优化的k-同构算法是相对高效的,比原有算法显著降低信息损失,又能提高匿名质量,有效保护用户的隐私信息。