社会网络数据发布中有效保护社区结构的匿名方法研究

来源 :广西师范大学 | 被引量 : 2次 | 上传用户:fsp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的普及使人们的社交模式发生了深刻变化,便利的平台也为人们的社交提供了巨大的方便。随着用户数量日益增加,网络数据量也越来越大,成为了当前互联网中的一种重要资源,其中,社区结构分析是社会网络数据应用的一个重要方面,可以用于相似群体发现、群体行为模式发现,从而制定商业推荐策略以及社会行为研究等。然而,这些数据中包含有大量用户的敏感信息,如果以其原有形式发布,将会泄露个人隐私;对数据进行匿名处理,将会修改原始数据,影响发布数据的实用性。因此,发布的社会网络数据用于分析的同时,如何在数据的隐私性和效用性两个方面取得优化平衡是一个关键性问题,围绕该问题的研究已经成为信息安全和数据分析领域的热点之一。数据的效用性与数据分析的目的紧密相关,因此,为了更好地保护数据的应用价值,数据发布中采取的隐私保护方法需要考虑数据分析的目的。然而,当前的社会网络数据发布的隐私保护研究中,较少考虑发布数据的具体应用,尤其是在针对社区结构分析的应用时,采用现有的匿名方法会牺牲较大的结构信息来满足匿名要求,对社区结构性质的分析带来巨大影响,极大地降低了数据的使用价值。本文针对以社区结构分析为目的的社会网络数据发布的隐私保护开展研究,提出在社会网络数据匿名发布中有效保护社区结构信息的方法。主要的研究工作如下:首先,指出针对社区结构分析的社会网络数据匿名发布的技术问题,并分析当前的隐私保护技术用于该问题时,存在的数据效用性降低的原理以及技术局限性。即研究在子图背景知识攻击模式下,k-匿名方法由于在聚类的过程中未考虑原始的社区结构,很可能使得原始属于同一社区的节点被分散划分到不同的组中,这在重构时将会模糊社区间的边界;又由于数据分析通常是以单个的节点和边为分析单元,k-匿名数据在分析前需要对发布图中的超级节点和超级边进行重构,这样很大可能使得社区间增加一些原本不存在的边,而导致社区边界变得更加模糊,此外,完全重构会产生较多的重构可能图,这些都会对数据的真实性造成较大的影响。然后,针对社会网络数据发布的k-匿名技术在社区结构信息分析研究中存在的信息损失过大问题,结合图中分组聚类技术和随机化技术,提出了一种新的局部扰乱的隐私保护方法。在节点分组的过程中,以距离和原始社区结构信息共同作为约束条件,使得原属于同一社区的节点尽可能分到一个组内;在重构的过程中,以组为单位,组间的连接结构保持不变,即将重构操作尽可能控制在社区内部或结构相似的节点之间,这样较大程度的降低了增加或删除边带来的社区间密度增大的可能,除此之外,也减少了重构带来的可能图数量。最后,基于提出的局部扰乱数据隐私保护方法,给出了详细的算法设计和实现过程说明,并结合社区结构分析中常用的检测标准以及图的结构性质,采用了三种验证匿名后数据效用性的评价标准。依据以上内容,本文给出了详细的系统设计方案以及各模块的实现过程说明。通过在三个真实的数据集上的实验结果分析,验证了本文方法的可行性,所发布的数据在满足k-匿名要求的前提下,对做社区结构相关研究有较高的效用性。
其他文献
数据挖掘技术具有较高的有效性和良好的可操作性,被广泛应用于各个领域。近年来,基于数据挖掘技术的研究方法不断涌现:如基于决策树分类、统计分类、贝叶斯分类、神经网络等方法
随着计算机的迅速发展,软件复杂性逐渐增大,软件质量问题受到越来越多的关注。软件测试是保障软件质量的关键技术,研究表明测试通常占总的开发费用的50%,因此有效的软件测试
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,各行各业积累了大量的历史数据,而这些激增的历史数据中往往隐藏着很多重要的信息。如何从历史数据中及时发现有用的
随着分布式计算技术的发展,Web服务已逐渐成为构造分布式计算平台的标准和现代企业的服务框架,其动态性、平台无关性、开放性以及松散耦合性等特点为信息系统之间的相互协作
迁移工作流是近年来工作流管理的一个新的研究方向。它将移动计算技术引入到传统工作流系统上,把工作流系统分为工作流引擎、工作位置和迁移实例三部分。迁移工作流很好的解
随着实际需求的变化,曲线的绘制方式不断的涌现,如参数三次曲线、B(?)zier曲线、B样条曲线、NURBS曲线。其中B样条曲线及其特例三次均匀B样条曲线在很多领域都得到了应用。B
光照问题是人脸识别面临的主要难题之一,由于光照变化改变图像灰度空间的分布,当使用灰度信息特征去识别人脸时,往往会使类内差异(同一个人的不同人脸图像)大于类间差异(不同
随着城市轨道的快速发展,行车安全受到越来越多的关注。在列车运行过程中,司机在长期集中注意力的情况下难免会有疏忽,借助计算机辅助列车安全运行已成为主流的研究方向。目
近年来人工智能渐渐成为改善和提高游戏质量的热门研究课题之一,在游戏设计中开发者越来越重视虚拟角色的智能行为。在游戏开发中,人工智能是一个既重要而又复杂的模块,虚拟
如今,随着商务化程度的不断提高,全世界商务机构的决策者们需要不断寻求新的方法来了解和提高他们的业务和产业。过去的历史告诉我们,知识需要去粗取精、不断的更新。几个世纪以