社交网络间用户身份识别算法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:caohf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代的网络中,一个乐于社交的人往往会拥有许多账户在不同的社交网络中,以享受不同社交网站提供的不同服务。当一个人加入一个社交网络后,他会填写个人资料并添加许多好友来享受更多的社交互动。而他的朋友也会在在其他的网站上做出相同的行为。由于没有一个全局ID来唯一标识一个人在所有的社交网络中,识别同一个人在不同社交网络中的身份来寻找你的好友在另一个社交网络中变得非常困难。一旦解决该问题,对检测垃圾邮件发送者,合并通讯录,广告推荐都有着重要的意义。用户身份识别指的是识别同一个现实中的人在不同社交网络中的多个虚拟账户。大多数现存的方法主要对用户属性进行字符串匹配,他们只是使用用户个人资料属性信息。但是这些信息或者因为用户保护自己而伪装起来,或者因为网站的缘故而将资料设为私密,我们经常难以获取到,但是在网络中,好友链接信息与用户的社交行为等信息确实很容易就获取得到的。在本文中,我们提出了一种新的局部的贪心算法,称为基于种子节点的传播的身份匹配,其完全结合了用户属性信息,链接信息和社交行为,并通过扩展种子节点来解决问题。在我们算法中,我们使用种子节点周围节点的信息,运用逻辑回归模型,通过和另一个网络中种子节点周围的节点作比较,对比他们的用户属性信息和周围的环境信息,不断识别新的链接,并把新的匹配账户作为加入到种子节点集合中。随着种子节点的传播,我们可以迭代地找到越来越多的链接。我们在Twitter和Facebook上进行广泛的实验来评估我们的算法,结果表明本文的算法显着提高了匹配结果,并且优于现存算法。
其他文献
随着技术差异性越来越小、国家对网络业务互相准入政策的放宽,国内外网络运营商就电信传统业务、网络增值业务甚至网络视频业务展开全面竞争,省有线电视网络公司面临着前所未有
企办学校作为我国基础教育的重要组成部分,是符合我国当时国情的具有中国特色的办学体制和模式。半个多世纪来,国企学校在减轻政府教育经费困难,满足中小学生受教育的需求,为国家
近期,中日两国关于钓鱼岛主权归属的争端日益激烈,受到国际社会的广泛关注。事实上,钓鱼岛争端是美国为干涉东亚事务而留下的一个抓手,在当前的美日博弈中备具"纠结",同时,钓
本文是关于农村经济增长中的农村金融资源供给及效应的理论及实证研究。论文首先回顾了经济增长和金融发展的相关理论和中国农村经济增长与农村金融发展的相关研究:然后在借鉴
台湾某净水厂采用超滤膜(UF)及低压反渗透膜(LPRO)组合深度处理技术,以去除水中重金属离子、悬浮固体、胶体颗粒、藻类、寄生孢子、病毒等危害人体的物质,同时节省了化学药剂
本文通过对华南女子大学各个发展阶段的研究,来探讨华南女子大学与福建近现代社会的关系,从而客观评价华南女子大学的办学特色、社会影响和历史作用。华南女子大学作为福建最早
随着气候干早、水资源减少以及土壤风蚀的加剧,近些年来,中国北部农牧交错区的生态环境面临巨大的威胁,其中土地沙化是影响当地经济发展以及造成环北京地区沙尘暴的主要原因
高度不确定性的“风险”有赖于媒体的呈现,但受制于传播机制与风险语境的信息传播本身,也可能牵动风险或危机。传播的价值悖谬与传播效果的逆转,构成风险传播的悖论。风险的
钓鱼岛争端对中日经济关系造成严重影响,双边投资受阻,贸易大幅度下降、中日互购国债与人民币直接交易受挫,中日韩自贸区谈判年内未能如期举行。但是,钓鱼岛问题并非中日关系