论文部分内容阅读
分别使用传统统计学方法与机器学习方法对北京市空气质量状况展开实证分析,研究"判别分析""决策树""支持向量机"和"随机森林"四种分类方法对于同一数据集的分类结果。为了研究该问题,首先对传统分类方法构建的判别分析分类器与机器学习分类方法构建的三类分类器进行了理论介绍,随后以4∶1的比例将北京市空气质量状况数据分为训练集与测试集,使用训练集构建分类器,对构建的分类器进行优化处理后,使用测试集进行分析及预测,根据预测结果对传统分类方