社交网络中的去匿名化与身份识别算法设计

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:godchrist
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,在线社交网络的应用越来越广泛,为人们的交友、生活提供了很大的便利。为了使用网络提供的服务,用户不得不将自己的敏感信息暴露于网络之中。经过匿名处理后的社交网络数据被广泛地共享、转发、发布给第三方,由此引发了一系列网络数据隐私泄露的危险。因此,社交网络中的数据隐私问题越来越引起研究者的注意。尽管数据在发布之前必须经过匿名化处理,如通过使用假名、数据净化、数据扰动的方式实现匿名性。但是攻击者仍然可以根据收集到的辅助信息实现匿名数据的去匿名化,从而获得用户的身份信息。本文从攻击者的角度出发,将收集到的辅助信息作为先验知识,实现对社交网络的攻击。在过往的研究中,研究者通常仅仅使用图的结构特征来去匿名化社交网络中的用户,而忽略了用户属性信息对去匿名化算法的影响。为了弥补这一缺陷,本文通过将属性相似度计算加入到整个的节点间相似度计算中,综合考虑了图的结构特性和用户的属性信息,使用户的个人档案信息更加完整。本文提出的基于结构-属性的去匿名化算法考虑图的匿名处理对用户匹配的影响,通过设置阈值来提高算法的精确度。在将去匿名化问题转化成图的节点匹配问题后,通过减少每次待匹配节点的数目,降低了算法的计算复杂度。根据节点度的幂律分布特性,算法首先去匿名化度最大的节点,减少了算法开始时的比较次数。此外,运用了谱划分的方法将社交网络图划分成互不相交的子图,使算法可以应用于大规模的社交网络中,可以有效地在多个处理机上并行处理去匿名化算法。在之后的工作中,通过研究跨社交网络间的用户身份识别问题,进一步对用户的身份信息以及用户档案进行合并收集,实现了对用户信息更为有效的攻击。在以往的跨社交网络用户身份识别过程中,由于实际网络之间结构的差异性以及用户信息的不一致性,仅使用单一的特征匹配往往不能精确地识别同一用户。针对这一问题,给出了基于网络结构和属性信息的算法。该算法以先验种子作为基础构造二部图,进而获得跨社交网络用户之间的映射。此外,从收集到的数据中可以看出,几乎每个社交网络中都含有用户名字段。所以,用户的用户名匹配可以有效地提高用户匹配的精确度。同时,本文也给出了跨社交网络用户识别算法的设计与分析,通过减少节点间的比较次数来提高用户身份识别的效用。
其他文献
“为中国人民谋幸福,为中华民族谋复兴,是中国共产党人的初心和使命,是激励一代代中国共产党人前赴后继、英勇奋斗的根本动力。”5月31日,在“不忘初心、牢记使命”主题教育工作
报纸
硝酸盐对自然水体和人类健康都有很大危害,多年来研究者们采取了各种方法处理硝酸盐污染,电化学反硝化法由于其操作方便、投资费用低、环境兼容性高、不产生二次污染等优点而
<正> 一种新颖的金属切割设备——G4025卧式带锯床在黄岩问世。去年十一月底,浙江省科委委托台州地区科委组织通过技术鉴定。该锯床由托料架、床身结构、工作台面、弓架结构
1选题目的草莓集营养保健为一体,被称为“果中精品”,但是人们只能在春夏之交吃到新鲜的草莓,而在秋冬季节的市场上草莓却是空缺无货。根据材料记载,草莓是多年生草本植物,按常规
<正> 许多国家的水质标准中,都有硼的标准,尤其在农田灌溉水质标准中,硼的控制指标更为严格,但我国现行的有关水质标准中尚无此项指标。因此,当遇到硼污染问题
番茄裂果是一种生理性病害,因栽培技术不当,裂果趋向严重,严重影响了番茄品质,降低了菜农经济效益。近三年中,针对此病笔者进行了实地调查、观察、摸索,初步掌握了裂果的原
经济的快速发展和生活质量的不断提高,使得人们时建筑设计提出了更高的要求.在建筑设计中最重要的就是建筑结构设计,而建筑结构设计的关键是稳定性设计,因此建筑的稳定性成为
韧带样型纤维瘤病又称侵袭性纤维瘤病是一种纤维细胞克隆性增生性病变,分类:腹部外韧带样型纤维瘤病(约50%~60%)、腹壁韧带样型纤维瘤病(约25%)、腹内韧带样型纤维瘤病(约15%)。发生于肋骨
随着对网络利用的日益增多,互联网在大学得到进一步发展和普及,网络已经成为高职学生学习生活中不可或缺的主要工具. 在对网络使用率的提高带来更多方便的同时,网络依赖的学
目的研究甲基莲心碱对D-半乳糖胺/脂多糖诱导的小鼠急性肝损伤的保护作用。方法将80只小鼠随机分为4组(n=20),在正常组和模型组小鼠给予生理盐水灌胃,而在另两实验组则分别给