社交网络中的链接预测研究

被引量 : 0次 | 上传用户:shenghuocc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近十年来,网络中的数据呈现出爆炸式的增长。在如此众多的信息中如何挑选出用户需要的精确信息以及如何挖掘出有用信息是数据挖掘研究的一个热门方向。有时候需要根据已有的信息来对未来的信息或信息的发展趋势作一个预测,从而创造一些应用。链接预测也是在这种情况下应运而生的。社交网络中的链接预测是指通过已知的网络结构等相关信息,例如根据新浪微博中人与人相互联系所组成的网络图,来预测网络中尚未连接的两个节点之间产生连接的可能性,以及未来两个节点发生联系的概率,如预测未来某段时间微博中哪些人会发生联系。预测那些事实上存在但是尚未被发现的连接实际就是一种数据信息挖掘的过程,而对于未来可能会产生的连边的预测就是估计一种网络演化的过程。传统的链接预测方法主要有三种。第一种是基于马尔可夫链、支持向量机或者是机器学习的。这种方法往往考虑的是节点的属性特征。该类方法尽管可以得到较高的预测精度,但是有一个缺点就是它的适用范围比较狭窄,只适用于节点属性真实明确的网络,因而其应用范围也受到限制。第二种方法是基于网络结构的最大似然估计,较少考虑网络节点属性的权重,主要考虑网络的拓扑结构,在处理明显层次结构的网络时精确度较高,但是因为每次预测要生成多个样本网络,因而计算复杂度也较高。第三种方法是基于节点相似性的链接预测方法,这种方法有比较好的预测精度,但是其性能还有待提高。本文提出了一种改进的节点相似性判定算法,充分考虑了网络拓扑图,在定义节点相似性时考虑了更多的指标,并针对新浪微博这种特殊的社会网络,引入了节点属性相关度这样一个重要的指标。本文在改进的节点相似性方法的基础上,又提出了一种混合时间序列链接预测算法,该算法充分考虑了以前各个时间点的网络结构图,通过建模来综合预测未来时间网络链接的情况。本方法既提高了链接预测的准确率,尤其对社交网络比较适用,而且计算复杂度也不高。
其他文献
本文详细地叙述了由顺丁烯二酸水溶液生产富马酸(即:反丁烯二酸)的全部工艺过程。重点强调通过改进生产过程中的关键工序,从而达到最大限度地提高顺酸异构化反应生成富马酸的转化
实现利率市场化是我国深化金融体制改革的重要目标,利率市场化的重点是如何确定与选择市场化基准利率的问题。目前,我国是由法定利率和市场利率组成的双轨制基准利率结构,虽然已
《全日制义务教育普通高级中学英语课程标准(实验稿)》明确规定:“在各类评价活动中,学生都应是积极的参与者和合作者。”还提出了形成性评价和终结性评价并重的评价思想,既关注结
创造性思维的培养不仅是大学的任务,也是职业院校的任务。该文从突破自卑障碍,打破定势思维,拓展知识视野三方面阐述了在化学教学中培养学生创造性思维的方法和手段,通过激发兴趣
随着市场经济的发展,假冒伪劣已成为我国社会生活中的最大问题,令人堪忧。国内防伪技术的推广和防伪企业的发展极为迫切,与国外大型的防伪企业相比,尤其在技术推广方面有较大的差
随着建筑师对形式语言的追求和环境观等概念的引入,国内外一些建筑师改变了以往的设计思想,在建筑设计的形态和空间方面有了新的认识,创造出动态感、流线感、模糊感、混沌感等“
1994年税制改革后 ,国家税务总局适时提出了深化税收征管改革、建立“以纳税申报和优化服务为基础 ,以计算机网络为依托 ,集中征收 ,重点稽查”的新的税收征管模式的要求。经过几
电除尘器具有除尘效率高、能耗低,运行及维修简单,价格相对也不高等特点,对于减少烟气中粉尘的排放,减低空气污染,有着十分重要的作用,是一种近年来获得广泛应用的环保除尘设备。高
伴随着中国女性地位的提高、女性话语权的回归以及女性自我意识的觉醒,女性杂志逐渐占据期刊市场的半壁江山。在引领女性进行自我认知的同时,女性杂志也开始以审视的眼光观察男
汉语虚词中连词是一个比较重要的成分,而复句学习中连词在内的关联词语也是主要的内容之一。复句在篇章、口语等语言表达的任何过程中是非常重要且不可缺少的一个语法手段。所