论文部分内容阅读
代表点选择是实现缩减数据集规模的有效途径,可以提高分类的准确率和执行效率。为此,通过引入分类置信度熵的概念,提出适应度评价函数,用于评估代表点的选择效果,以此找到最优的代表点集。该方法可与其他代表点选择方法结合,得到性能更优的代表点选择方法。与多个经典代表点选择方法进行实验比较,结果表明基于置信度的代表点选择方法在分类准确率和数据降低率上有一定优势。