论文部分内容阅读
收集大量网站的包含30个特征属性的数据,用 k-means 属性聚类方法将特征属性划分为不同类别,利用不同类别中的属性数据训练基础分类器,通过集成各基础分类器的结果对未知网站进行预测。采用简单投票和贝叶斯投票对结果进行组合预测,结果表明,k-means 属性聚类方法大大增加了基础分类器的差异性,提高了分类检测的精度,其中基于贝叶斯投票策略的集成模型具有很高的检测精度。