论文部分内容阅读
雾霾舆情是近年来社交网络讨论热点.文章以新浪微博雾霾短文本信息为数据源,在数据清洗和人工标注后,构建了以健康信息为分类标准的数据集.在实验数据基础上,利用SVM模型,通过CHI统计量方法自动标注社交媒体中用户对雾霾的健康信息表述.实验结果表明,在准确率上可以达到较高的准确率和查全率,即可以通过机器自动分类形式对雾霾微博中的健康信息进行有效标注.