在线社会网络上的影响最大化研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:gg5921
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
病毒式营销被认为是最有效的营销方式之一,借助人与人之间的影响作用实现营销信息在消费者之间自发的扩散。随着信息技术的迅猛发展,大量在线社交网站和社会媒体网站涌现并成为人们交流和分享信息的重要平台,给病毒式营销的发展带来重大机遇,因此这种营销方式变得日益流行。病毒式营销的一个关键问题是种子用户选择,即定位一组种子用户作为营销的初始投放对象,以期获得最大的影响范围——社会网络中被影响的用户数量,该问题通常被称为影响最大化问题。作为社会网络分析的一个重要问题,影响最大化问题近些年随着在线社会网络的兴起得到学术界和工业界的广泛关注。在线社会网络规模大、拓扑结构复杂等特点给求解其上的影响最大化问题带来很大困难,体现在对影响最大化算法的可扩展性、鲁棒性和求解精度上的挑战。因此,研究在线社会网络上的影响最大化问题具有重要的理论意义和应用价值。  本文对在线社会网络上的影响最大化问题展开研究,针对在线社会网络规模大、拓扑结构复杂多样的特点,分别研究了具有高可扩展性的影响最大化近似算法和鲁棒性良好的启发式影响最大化算法。进一步的,本文从在线社会网络上营销场景的特点入手,研究了精准的影响最大化方式。本文的主要贡献及创新之处如下:  本文首先针对求解影响最大化问题的经典贪婪算法面临的可扩展性与精度保障两难的问题,提出了一种非常有效的解决方法。本文指出该问题的根源在于,现有贪婪近似算法执行过程中影响范围函数的子模性和单调性存在被破坏的风险。为降低这一风险,这些算法每次估计影响范围时需要采用大量蒙特卡罗模拟,导致可扩展性差。基于上述认识,本文提出了一种快速的贪婪近似算法StaticGreedy,通过重复使用一组蒙特卡罗模拟结果估计影响范围,严格保证了影响范围函数的子模性和单调性。这使得StaticGreedy只需要采用少量蒙特卡罗模拟就能收敛至一个理想的解集,与现有贪婪近似算法求解精度一致但运行速度快了1000倍以上。本文还根据StaticGreedy的特点设计了一种加速策略,使其运行速度进一步提高了10倍左右。  本文随后针对当前影响最大化算法在不同网络上性能表现不稳定的问题,提出了一种高效的启发式影响最大化算法框架IMRank并给出其具体实现。本文从贪婪算法的解集性质出发定义了一种特殊的节点排列——“自洽排列”,其中节点按其基于该排列的边际影响范围降序排列。IMRank通过迭代调整初始排列以获得在影响最大化问题上性能表现良好的自洽排列。其迭代方式非常高效且收敛性具有理论保证。一些简单的初始排列就能使其收敛至与贪婪算法解集性能接近的自洽排列。在IMRank的具体实现中,本文针对独立级联模型设计了一种高效的由后至前分配策略,能高效地计算所有节点基于给定排列的边际影响范围。大量实验表明,IMRank在运行速度和求解精度上的表现都优于现有的启发式影响最大化算法,具有更好的鲁棒性。  本文最后探讨了现有影响最大化算法求解精度有限的问题,设计了一种面向在线营销场景的动态影响最大化,有效提高了影响最大化算法能获得的影响范围。其核心是分批动态选点方式,这是指允许在一次实际扩散的多个时刻分批地选择和投放种子节点,并在此过程中利用在线营销下可收集的实时扩散信息指导后续种子节点选择,从而提高单次扩散的影响范围。为更好地应用这种方式,本文提出了一个动态影响最大化问题,该问题是寻找一组最优时刻集合,使得依据该组时刻选择种子节点下,在给定截止时刻获得的影响范围最大。本文提出了两种有效的启发式算法求解该问题,并从理论和实验两方面证实了,优化种子节点选择时刻有助于算法获得更好的影响范围。在一些情形下,利用分批动态选点方式,基于度的简单种子节点选择策略就能得到比传统贪婪近似算法更大的影响范围,并且时间开销显著更低。
其他文献
二进制翻译技术通过将已完成编译的客户机指令翻译为宿主机指令,实现既有软件的跨体系结构运行,以解决不同体系结构之间的软件兼容问题。执行效率较低是制约二进制翻译发展的主
石油物探是人们勘探地下油气资源的重要手段,通常的勘探方法是地震勘探,通过地震勘探可以比较准确地了解地下构造,地质层位和断层分布。但是在实际勘探中,特别是海洋勘探中,人们发
该论文介绍了一种基于PSTN网的远程电话语音采集与传输系统的软件和硬件电路,提出了通过高效的电话语音采集和压缩技术,借助于PSTN网进行传送的方法.采用远端处理机和中心站
学位
随着互联网与分布式技术的快速发展,面向服务的体系结构(SOA)得到了学术界和工业界的青睐和广泛应用。作为一种基于互联网标准和XML规范的新型分布式计算模型和实现SOA的主要
该文全面论述了移动Agent技术的发展、概念、理论和应用.然后,通过与传统技术的比较分析,对移动Agent技术进行了评价.提出了一个新的观点:移动Agent的实质是信息与服务的分离
该论文主要介绍了自由软件及其优秀代表Linux操作系统. 文中详细论述了自由软件的起源及其通用公共许可证,并分析了自由软件的特色、开发模式及其对中国的意义.文中详细论述
通过打印日志来增进调试是软件故障诊断中常用的方法。而在实际中相关日志缺失情况严重。对此我们针对一个具体的错误情景来增加日志以增进故障诊断:数组越界检查。静态数组
医疗信息交换平台,是连接医疗卫生机构基本业务信息系统的居民电子病历交换和共享平台,是不同医疗系统间进行医疗行业数据整合的基础和载体,可以使区域内、外的医疗信息实现共享。在全中国范围内,人口流动性大,医疗信息化建设不均衡,导致患者电子病历文件难以共享的局面。为了整合卫生信息资源,减少重复投资,实现卫生数据共享和交换,本文的具体研究工作如下:首先,提出基于区域的医疗信息交换平台扮演“邮局”的角色,以个
  本文首先阐述了Internet的发展对数据库技术的影响,简要的介绍了目前流行的Web开发工具,并进行比较。然后针对Browser/Server系统的主要问题和技术要点,概括了使用CGI开发一