基于多目标决策的微博用户影响力评价算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:fxl207111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博作为社交媒体的一种形式,具有信息传播快、来源广和多角度等特征,已经成为人们日常信息交流和分享的主要渠道,吸引了国内外学者的广泛关注。研究用户影响力对于微博的用户推荐、信息扩散、舆情监测和定向营销等具有重要的意义。首先,通过分析微博消息传播机制,构建了微博网络模型,并把微博网络细分为两个网络:用户关系网络和博文传播网络。然后,结合新浪微博的特征,为了有效地避免“僵尸粉”的影响,防止用户采用对博文的自我转发、自我评论等操作来恶意提升自己的影响力,从用户关系网络和博文传播网络两个角度,定义了四个评价用户影响力的指标:LeaderRank影响力、博文平均被转发数、博文平均被评论数和博文平均被赞数。在此基础上,为避免给不同指标确定合适的权重参数,引入了多目标决策中经典的Skyline计算方法,提出了WeiboLeaderRank影响力评价算法,并分析了该算法的特点。为了验证算法的有效性,使用网络爬虫技术,设计并实现了新浪微博数据采集系统,建立了包含125207个用户的微博研究数据集。由于微博服务器检测到异常的访问请求时,会采取重定向访问请求或禁止用户访问等措施,这会严重影响采集的速度。为解决这一问题,采用了多账号模拟登陆,一个账号开启一个线程,多线程同时采集的方法。线程使用匿名代理服务器请求数据,并动态改变请求HTTP头部信息,同时加入异常检测模块,及时发现异常情况并采取相应的操作,尽量模仿正常的用户访问行为,提高采集效率。最后在采集的数据集上进行实验,验证了四个影响力评价指标的有效性,并把WeiboLeaderRank算法和其他常用的用户影响力算法进行比较,结果表明WeiboLeaderRank算法评价效果更好,并且计算时间是随着数据量地增长而线性增加的,算法能适应超大规模的真实微博环境,同时具有较好的实时性。
其他文献
本文首先回顾了近年来国外基于语料库的口语研究,并在此基础上具体讨论了德语口语不同于书面语的几大特点,包括口语的语境共享、简单模糊、实时互动和感情流露等。德语口语语法
目的:研究百部新碱与罗汉果皂苷Ⅴ联用后对小鼠镇咳、祛痰作用的影响,并筛选其最优配比.方法:各实验均选70只小鼠随机分为7组,分别为溶剂组(生理盐水)、可待因(15 mg/kg)或氨溴索(30
【正】 据说,今年惊险、武打样式的影片有30多部。数量多,说明我们常有的赶浪头现象,还不足以作为批评的依据。如果说真能闯出一条新路,在影坛的百花园中绽开几朵奇葩,未尝不
<正>随着社会经济水平的提高,养宠物的人越来越多,过敏的人也越来越多,宠物与过敏的关系随之受到关注。宠物的皮毛、皮屑、分泌物、排泄物等均可以导致过敏。主要表现为呼吸
会议
一、社会领域的两个子领域社会学习要力行,人际交往多沟通,第一个子领域:人际交往。强调社会领域学习重在“力行”即“做中学”.人际交往能力主要在与成人和同伴的交往沟通的过程
成人和孩子有着不一样的思维方式。我们常常看到不了解孩子心理的家长对着孩子唠叨或者大喊大叫,可孩子就是不配合。当了近二十年的教师,我渐渐进入了幼儿的世界,了解了幼儿的语言习惯。下面这几个小例子,会让我们明白,只有洞察幼儿的心理,了解幼儿的感受,教师才能轻松有效地与幼儿互动。  到了小班下学期,我的班上还有好几个孩子在进教室之前总是黏着家长,愁眉苦脸地不让家长离开。教师和家长好说歹说都不起作用。常常是
交际离不开语言,交际能力的培养是高职生学习英语的最终目的。本文分析了高职生的学习目的,从课堂教学方法、教学内容、教学形式以及课外活动的开展等方面探讨如何培养高职生
实施金融带动战略,是促进经济金融和谐发展的重要举措,也是一项艰巨的系统工程,需要政府的统筹组织、企业的积极配合和金融机构的鼎力支持。只有共同打造良好的经济金融运行环境
一、强化西部文化资源产业的特色领域 (一)要依靠文化资源优势,形成文化资源产业经营特色。在文化产业起步阶段,文化资源就是文化资本,文化资源优势决定文化产业的特色领域。西部
4月14日,省委常委、省委组织部部长李元平一行莅临二车项目调研指导工作,省政协副主席、庆阳市委书记贠建民,庆阳市委常委、组织部部长马骥,市委秘书长张希岳,原省交建集团,