基于强化学习的影响力最大化研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:b999123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络分析是人工智能的重要分支,而社交网络上的影响力最大化问题自提出以来就受到广泛关注,研究学者为此提出了诸多模型和算法。目前有关研究主要关注根据目标影响范围或者限制条件给出一次性选点的静态策略,没有考虑对于影响力最大化问题的动态建模问题。然而,在实时变化的网络状态中,静态策略未必能够取得好的影响力效果。本文提出基于强化学习对影响力最大化问题进行研究。强化学习算法中智能体根据与环境的历史交互序列进行学习,这些序列具有天然的时间特性,因此强化学习算法能够给出时间层面上满足限制条件的影响力最大化动态策略。同时,强化学习算法给出的动态策略能够应对不断变化的网络状态,根据网络实时状态给出即时的影响力最大化策略。另外,强化学习算法支持对奖赏值进行灵活设置,基于此能够实现影响力最大化问题中激活种子节点的成本控制。本文将影响力最大化问题分为单智能体和存在竞争者的多智能体影响力最大化问题。为单智能体影响力最大化问题求解动态策略,首先将其建模为具有马尔科夫性质的动态最优规划问题,构建强化学习框架,然后选择合适的算法进行仿真实验。在与部分经典影响力最大化算法的对比中,强化学习算法具有明显优势。影响力最大化问题本身是NP-hard的,多智能体影响力最大化问题的求解更加困难,目前少有对多智能体影响力最大化问题动态纳什均衡策略的研究。本文使用基于Self-play思想的DQN算法、Nash Q Learning算法和Nash DQN算法对多智能体问题进行求解。基于Self-play思想的DQN算法适用于多智能体依次执行动作的情境,并且能够将多智能体影响力最大化问题缩减为两智能体影响力最大化问题。Nash Q Learning算法适用于小型网络,能够保证收敛到纳什均衡策略。Nash DQN算法通过神经网络求解近似纳什均衡,能够对规模稍大的网络进行求解。虽然本文提出的多智能体影响力最大化算法在大规模网络上表现并不出色,但是多智能体系统模型复杂,因此这一问题本身十分困难,本文提到的方法为多智能体影响力最大化问题的相关研究提供了一个崭新的思路。
其他文献
随着互联网技术的发展,传统的纸媒新闻已经无法满足全民追求便捷、快节奏的生活方式的要求,网络新闻应运而生,它因具有时效性、传播范围广等特点,而逐渐成为人们获取最新资讯
谨慎性原则在会计信息质量要求中,始终作为一个重要原则应用于实践当中。在实践应用当中,谨慎性原则的实际应用与许多实践环节相冲突,成为影响会计工作与会计信息质量的重要
【目的】以技术的智能性推动出版的科学性,为我国出版业的发展以及新旧媒体的融合发展注入新动能。【方法】采用文献分析法对人工智能与出版融合发展的基本理论与现实问题进
在人人都有"麦克风"的新兴媒体蓬勃发展时代,社会公众的表达欲和媒介素养逐步攀升,舆论引导得不好就会"众声喧哗",引导得好就能凝聚"万众一心"的正能量。此次疫情防控中,北京
目的:检测Polo样激酶1在胶质瘤中的表达,探讨其临床意义。方法:应用免疫组织化学方法检测PLK1的表达,并对患者进行随访。结果:正常脑组织未见PLK1明显表达,各级别胶质瘤均有PLK1
目前我国的财务管理仍有待完善与加强,如何对企业财务信息化管理进行建设,成为我国企业财务发展的一个重要内容。因此,文章针对企业财务信息化管理进行了深入的探究和分析,提
肺母细胞瘤(pulmonary blastoma,PB)又称为肺胚瘤(pulmonary embryoma),是一种罕见的肺原发恶性肿瘤.在肺部原发性恶性肿瘤中发病率仅占0.25%~0.5%,据统计,截止2005年4月国内共报
研究背景:甲状腺是人体非常重要的腺体,其产生的甲状腺激素与人体生长发育和糖脂代谢密切相关。本研究旨在分析在甲状腺功能正常人群中,甲状腺相关激素(TSH,FT3,FT4)与体重指数(BMI)、血脂之间的关系;以及甲状腺功能正常组和亚临床甲减组的甲状腺相关激素与糖化血红蛋白(HbA1c)的关系。研究方法:我们收集了97997人的横断面数据,使用R语言对数据进行基本的统计分析和建模,同时采用广义加权模型
目的:观察胸腔持续闭塞引流联用高聚生治疗恶性胸腔积液的疗效。方法:随机选择57例患者分为治疗组31例,对照组26例。治疗组采用胸腔持续闭塞引流联用高聚生的方法,对照组采用常规
目的探讨老年高血压患者冠状动脉造影(CAG)的特点及其影响因素.方法对2330例老年高血压患者的相关临床资料与CAG的结果进行回顾性分析.结果①老年高血压CAG阳性率高占82.0%(1