社交网络中基于属性的影响力节点挖掘

来源 :东南大学 | 被引量 : 0次 | 上传用户:lanyezy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,随着互联网的发展,在线社交网络(如Facebook、Twitter等)的成功应用,网络上存在大规模的真实社会数据,催生了社交网络在计算机领域的蓬勃发展。在信息传播研究领域,病毒式营销(viral marketing)是一个广为研究的问题。在社交网络中病毒式营销的一个具体方案是找出最有影响力的用户,将这些用户作为信息的源头,通过口头传播方式使得信息最终能够到达网络的大部分,这也就是影响最大化问题的原型。  然而,这种病毒式营销使用的是“广而告之”的广告模式,这种广告模式在近几年的实践中,取得的效果不甚理想。为此一种与“广而告之”对应的新型网络广告模式-----“窄告”被提出。窄告会根据浏览者的偏好、使用习性、地理位置、访问历史等信息,有针对性地将广告投放到真正感兴趣的用户面前。基于以上考虑,本文将病毒式营销手段和窄告这种个性化的广告模式结合起来,提出了带属性的影响最大化问题。  针对这个问题,本文提出了一种概率和覆盖算法(Sum of Probability CoveredAlgorithm,简称SoPCA)和两种基于局部社区的算法,社区识别算法分别是Community-Based Algorithm(CBA)和Improved Community-Based Algorithm(ICBA)。其中ICBA是对CBA在时间复杂度上的改进算法。基于以上算法的研究成果,本文设计并实现了社交网络影响力节点挖掘原型系统。  本文在六个数据集和拓展独立级联传播模型上进行了实验,结果表明:(a)为避免影响范围重叠问题,在算法中引入覆盖距离是有效的,最佳覆盖距离的选取受边上影响概率影响;(b)本文提出的算法的影响范围优于其他启发式算法,且网络中目标节点(与商品目标受众属性相似度不为0的节点)数目越少,算法的优势越明显;(c)在本文提出的三个算法中,ICBA的影响范围最佳,其次是CBA,SoPCA最差;在时间性能方面,SoPCA最快,其次是ICBA,CBA运行时间最长。
其他文献
空间表达式的识别与分析来源于国家自然科学基金资助项目“基于Ontology的文本中空间关系三维可视化”,是该项目自然语言处理部分的第一步。在空间关系三维可视化的过程中,包
数据挖掘是指从大型数据库或数据仓库中提取隐含的、先前未知的、对决策有潜在价值的知识和规则。它是人工智能和数据库发展相结合的产物,是目前国际上数据库和信息决策系统的
随着传感技术、通信技术和计算机技术的飞速发展,无线传感器网络作为一项新型的信息技术日益受到国内外的高度重视,被广泛应用在军事侦察、环境监测、医疗监护、空间探索、城
电力行业是国民经济的支柱产业,所以实现电网信息化对提升工作效率和改进工作方式意义重大。随着电网信息化要求的不断提高和新业务需求的不断增加,接入智能电网的设备种类越来越多,所以安全接入平台不仅要满足工作人员在使用过程中的快捷、便利,同时还要保证内网数据的安全性,这就要求对接入设备进行安全接入和实时监控,这样才能有效地保护内网数据安全性并为各业务部门提供方便、快捷的服务。本文为智能电网设计了一个有效的
近年来,无线传感器网络中的能量补充技术在学术界和产业界受到广泛关注。根据能量来源的不同,现有的能量补充技术可大概分为两类,一类利用外部环境的可再生能源,如传统的太阳能、
无线传感器网络越来越多的被部署到医疗、灾害管理等数据密集型业务之中,这些业务经常因为无线通信信道繁忙而受到严重的干扰。对遭受干扰的节点的性能进行精准刻画对拥塞控制
虚拟现实(VR)是一种高度逼真地模拟人在自然环境中视、听、动等行为的人机界面,它综合了计算机图形学、图像处理、传感技术、多媒体技术、网络技术等多门科学。三维实体建模技
顶板事故作为煤矿的主要安全事故给国家财产和人民的生命安全造成了巨大的损失和威胁。据国家有关部门统计,我国煤矿发生顶板死亡事故占煤矿死亡事故的40%~50%,其中80%发生在采场,工
在过去的几十年间,许多经典的模型在信息检索领域诞生,诸如布尔模型、向量空间模型以及概率模型等。1998年,Ponte和Croft首次将统计语言模型应用于信息检索,并且提出了查询似然语
VoIP系统一般基于SIP(Session Initiation Protocol)或H.323两种通信控制协议。SIP协议具有结构简洁、易于扩展和适合Internet接入等良好的特性,它可以有效地控制媒体网关,控