论文部分内容阅读
最小生成树数据描述(MSTCD)在刻画高维空间样本点分布时,将所有图形的边作为新增虚拟样本以提供目标类样本分布描述,这种描述存在分支多、覆盖模型复杂的问题.针对该问题,依据特征空间中同类样本分布的连续性规律,文中提出基于稀疏最小生成树覆盖模型的一类分类算法.该方法首先构建目标类数据集的稀疏k近邻图表示,通过递归图分割算法发现数据分布的微聚类,再以微聚类的中心为图节点构建目标类的稀疏最小生成树覆盖模型.实验结果表明,文中方法与MSTCD和其它一类分类器相比有较优的描述性能和较低的模型复杂度.