基于用户特征的信息传播方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:qweasd21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联飞速的发展,手持终端的普及以及社交平台的推广,信息的传播方式发生了本质的变化。微博作为一个开放的平台,用户之间的关注不需要认证,信息传播具有速度快、范围广的特点。如何有效的预测信息的传播成为亟待解决的难题。目前基于网络社交平台的信息传播模型的研究,主要集中在社交网络结构和信息内容对信息传播的影响这两方面。而针对个体特征和新用户对信息传播的影响研究不够深入。针对微博平台,微博的转发是信息传播的基础。本文重点研究用户对微博的转发会受到哪些个体特征的影响,如何通过这些特征有效的预测用户的转发行为,然后对于历史信息不足的用户,提出通过相邻好友预测微博转发行为的方案。首先本文将微博的转发行为看作是发送者、接收者、微博这三个实体间的相互作用。提取用户特征的时候先考虑每个实体的特征,然后考虑两两实体间关系的特征,本文共提取了11个特征。其中发送者权威特征是通过PageRank算法衡量的,该特征反映了发送者在网络中的位置特征。对于兴趣相似特征,首先使用LDA模型对用户的历史微博信息进行建模,得出用户微博的主题分布,然后使用改进后的KL算法度量两个用户兴趣的相似度。对提取后的特征进行归一化处理,使用SVM算法进行微博转发的预测,同时本文还考虑了非平衡数据集对SVM算法的影响。使用基于SVM的过采样方法优化数据集,可以提高预测效果。同时本文还构建了好友选取模型,对于缺乏历史信息的用户,通过好友选取模型从相邻的好友中选择一位亲密好友作为参考好友,来预测微博的转发行为。该模型选择好友的原则是:对于相同的微博,转发行为越相似,则越有资格作为参考好友。本文提出的方法使用新浪微博的真实数据集进行验证,并和常用的逻辑回归算法和朴素贝叶斯算法进行了对比。实验结果显示本文提出的方法有效的提高了预测结果的准确性,并且对缺少历史信息的新用户,当其他算法都失效时,本文提出的算法依然有不错的效果。
其他文献
维吾尔族有一种专门为婴儿设计制造的“摇篮”,称作摇床(维吾尔语称“布休克”)。这种摇床很久以前就已经在维吾尔、哈萨克、柯尔克孜、乌孜别克等民族中普及。维吾尔族的摇
本文使用的消解剂为HNO3-H2O2体系,样品经浸泡后,放入微波消解仪中进行样品前处理,用石墨炉-原子吸收光谱法测定梭子蟹中铅,对本方法中的微波消解条件、仪器运行条件、基体改
目的探究睡眠状况对社区冠心病老年患者认知功能的影响及中药熏洗配合穴位按摩的效果。方法随机抽取2016年1月-2018年4月我院110例社区冠心病老年患者为观察对象,对其临床资
本文主要研究了杜邦分析法在企业财务分析中的应用,以统一企业为研究案例,选取2017-2018年的财务数据进行分析,以净资产收益率为主,对统一企业2018年净资产收益率变动的主要
为了研究机油加注量或机油液面高低与机油消耗的相互关系,通过理论分析结合试验研究给出机油液面高低和机油消耗的内在联系,研究结果表明,如果机油液面低于标准液面,机油消耗
学校场馆设施是为了学生服务的,它是代表学校容貌的一项重要工程。管理好学校的场馆,不仅是对学校资源的充分利用,更是给学生创造了学习的空间。通过体育设施的管理,可以加强体育
结合万华化学(宁波)氯碱有限公司液氯气化器的使用实践,对液氯气化器经常出现泄漏事故原因进行了分析,从事故危害、产生原因与对策及使用、维修和管理等方面进行了阐述。
以4个杂交中稻品种为材料,采用桶栽方法在模拟洪水和实地洪涝条件下,研究了在水稻不同生育时期模拟洪水淹没的深度、时间对产量损失度的影响。结果表明,淹没对产量损失度的影
在新世纪到来的第一个春天,广受关注的“北京城市房地产交易会”将在2000年5月31日在国贸中心开展,为了及时获取展会的有关信息,我们于开展前来到忙碌中的展厅。 一个个制作