论文部分内容阅读
微博评论信息的具有发表随意、传播迅速,影响广泛等特点,在给用户带来便捷的同时也吸引大量垃圾制造者的目光,微博也成为垃圾评论和不良信息发布的平台,因此,微博评论必须进行有效的检测与过滤.选取J48决策树文本分类的方法对微博垃圾评论在常用词表的基础上,选取微博上关注度较高的评论信息作为实验的训练集,以准确度、召回率和查准率等数据验证所选取方法的可靠性,并以实验数据结果验证了方法的有效性.