面向不平衡微博数据集的转发行为预测方法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:linhom222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对微博转发预测方法研究中的数据集不平衡问题,提出了一种融合过采样技术和随机森林(RF)算法的微博转发行为预测方法。首先,定义了个体信息、社交关系和微博主题3类与微博转发行为相关的特征,并基于信息增益算法实现了关键特征选取;其次,综合微博特征数据的特点来改进少数类样本合成过采样技术(SMOTE),对原始数据集进行非参数概率分布估计,并根据近似概率分布对数据集进行过采样处理,从而使正反例数据量达到平衡;最后,利用随机森林算法,依据微博转发关键特征进行分类器训练,并利用袋外(OOB)数据误差估计来分析和设置随
其他文献
针对高寒区沥青路面容易出现低温开裂的问题,从SBS改性沥青技术着手对其进行改善。首先,对70#基质沥青及3种不同SBS掺量的改性沥青进行BBR试验,然后,对其沥青混合料进行TSRST试验
研究目的是分析正面冲击载荷条件下,胸腔骨骼结构和软组织结构材料参数的变化对胸部不同碰撞响应参数的影响。采用一个已经建立并验证的人体胸部有限元模型,基于胸腔骨骼和软
目的探讨氯氮平发生不良反应的特点及相关因素,为临床安全用药提供参考。方法对中国知网2003年1月至2008年12月发表的文献进行检索,检索到氯氮平引起不良反应个案报告55篇,涉
文章通过分析国内外秸秆综合利用的发展现状,总结了我国秸秆利用方面存在污染环境、利用率低和产业链短等问题,针对这些问题文章分析了秸秆综合利用的最新方式——秸秆发酵饲
目的:研究全面质量管理应用于西药房管理的效果。方法:医院西药房自2018年1月开始实施全面质量管理,2017年为实施前,2018年为实施后,实施前后各随机选择1 200患者为研究对象,
微波技术作为一种高效的物理方法,具有广泛的应用价值,近年来已成为国内外研究的热点。介绍了微波对蛋白质的作用机制,并围绕微波在蛋白质研究过程中的生物化学分析、多肽制
<正> 1979年发表的一份WHO备忘录(BullWHO 57:227,1979),曾报道组织一个小组重新考虑1971年决定的流感病毒命名系统的结论。这个小组复习了近8年中流感病毒的免疫学、生物学
论证了支撑剂体积密度、视密度和绝对密度的概念与内涵,降低概念混用现象的发生。结合SY/T5018-2006和SY/T5018-2014两个标准,重新设计了测定视密度的方法、步骤和计算式。分
本文在SiO2/M(M=Fe,Co,i)复合气凝胶骨架上采用气相催化裂解乙炔的方法合成出SiO2/C/M气凝胶纳米复合材料,用扫描电镜、比表面分析仪、激光导热仪等对材料的结构和物理性能进
在新时期,探索高校党员教育基地的建设模式,是创新学生党员教育形式,提高党员教育实效性的重要途径,是完善党员再教育和考评体系的有益探索,也是落实党员先进性教育长效机制