一种决策树算法对微博垃圾评论的检测

来源 :内江师范学院学报 | 被引量 : 0次 | 上传用户:sunwen_fly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博评论信息的具有发表随意、传播迅速,影响广泛等特点,在给用户带来便捷的同时也吸引大量垃圾制造者的目光,微博也成为垃圾评论和不良信息发布的平台,因此,微博评论必须进行有效的检测与过滤.选取J48决策树文本分类的方法对微博垃圾评论在常用词表的基础上,选取微博上关注度较高的评论信息作为实验的训练集,以准确度、召回率和查准率等数据验证所选取方法的可靠性,并以实验数据结果验证了方法的有效性.
其他文献
财政部等单位近日制定《家电下乡操作细则》,大幅简化补贴审核兑付程序。据悉,试点省市将取消乡镇财政所审核、县财政局兑付环节,改为销售网点代审、乡镇财政所兑付。补贴资金须
基于单状态选择催化还原(SCR)模型,应用多目标遗传算法对SCR系统进行优化。获得了最优氨覆盖率目标值,优化了SCR系统NOx排放和NH3泄漏之间的此消彼长(tread-off)的关系,分析
针对纯电动车整车控制器(VCU)的数据测量和标定问题,设计了基于控制器局域网标定协议(CCP)的标定系统,分析了VCU的控制策略,阐述了CCP驱动等软件的实现过程。采用上位机软件C
目的探讨急性ST段抬高型心肌梗死(STEMI)合并心源性休克(CS)患者行急诊经皮穿刺冠状动脉介支架植入术(PCI)及床边行主动脉球囊反搏(IABP)的治疗及护理。方法选取1例突发急性S
遥感技术作为研究构造活动性的一种重要手段,可获取构造地貌的空间分布及水平位移分量,但无法量算垂直位移分量.应用高分辨率数字高程模型(digital elevation model,DEM)数据,得到的地貌指数可定量化表达地貌表面的三维特征,对垂直位移分量的量算具有独特优势,可弥补遥感解译方法的不足.本文以当雄县宁中盆地及邻域为研究区,利用12.5 m分辨率DEM数据计算7种地貌指数,包括山前曲折度
众所周知,再进行土建施工过程中,因为其施工时间过长、工种多样,容易受到外界环境因素的影响,导致建设环节中对于施工技术要点和整体质量把控具有很大难度。不仅如此,对于土
综合利用高浓度有机废水生产有机肥冯东勋,乔素兰l前言有机肥的施用可增加土壤有机质的含量,改良土壤团块结构和物化生物性质,使土壤永远保持良好的生产状态,减少土壤对N、P、K的固定
降低汽油机部分负荷泵气损失需要灵活的可变气门机构,凸轮驱动式液压可变气门具有较好的应用前景,但依然面临压力波动和气门落座速度难以控制等问题。本文中通过调节节流阀开
采用内冷油腔冷却可显著加强活塞的传热,但也会影响活塞头部的强度。为系统研究活塞结构与位置参数对活塞传热与结构强度的影响,优化内冷油腔的型式与其在活塞中的位置,以一
区域环境影响评价与乡镇工业的合理布局浙江大学张钢改革开放以来,乡镇工业发展迅猛,对国民经济的贡献也急剧增长。(详见表1)但是,乡镇工业在高速增长的同时也付出了沉重的环境代价