论文部分内容阅读
随着网络通信技术的发展,社交网络日益成为人们分享和传递信息、维护和拓展社会关系的重要平台。社交网络中生产和传播的数据反映了真实的社会关系,包含了错综复杂的人际关系及大量的个人信息。这些数据已经被广泛应用于社团结构分析、群体行为分析、舆情监控等领域,具有极高的科研及商业价值。由于数据共享和学术研究的需要,大量社交网络中的数据被收集和发布,其中的隐私泄露问题不容小觑。如何权衡个人隐私的保密性与发布数据的可用性之间的平衡,已经成为社交网络数据发布过程中急需处理的难题。现有的社交网络隐私保护算法,通常采用统一的泛化标准,并未考虑节点隐私保护的差异性需求,均一化的保护策略不仅会过度保护网络边缘节点,降低发布图可用性,也会导致对局部核心节点的保护强度不足等问题。因此,本文提出了一种基于社团划分的社交网络分级隐私保护算法,实现了对于网络中处于不同结构特征中节点的分级隐私保护。本文的主要工作有:1)针对社交网络社团划分中存在的稳定性较差的问题,本文提出一种基于节点影响力因素的LPA算法,通过综合评估节点的影响力,按影响力由高到低的顺序对节点标签进行异步更新。在数据集Pokec上的实验表明:基于影响力因素的LPA算法与LPA算法相比,模块度提升了6.42%;与LPAm算法相比,模块度提升了4.28%,社团划分质量更优。2)针对社交网络隐私保护中存在的均一化问题,本文提出了一种基于社团划分的分级隐私保护算法。采用不同强度的匿名算法对影响力不同的节点进行泛化,实现了个性化的隐私保护需求。针对局部核心节点更高的隐私保护等级需求,本文创新地提出了一种综合敏感属性分布的(?)匿名算法,对边敏感属性分布及社团标签分布情况进行约束。在数据集Pokec上的实验表明:基于社团划分的分级隐私保护算法与k-degree-l-diversity匿名相比,信息损失率减少了3.54%,边数变化减少了6.32%,平均路径长度增加了5.58%,发布数据的质量更高。综上所述,与传统的无分级隐私保护算法相比,基于社团划分的社交网络分级隐私保护算法充分利用并保持了图结构特性,降低了数据损失程度,增强了数据可用性,并实现了对核心节点的有效保护。