论文部分内容阅读
孤立点检测是数据挖掘中一个非常重要的应用,被用于发现隐藏在大数据集中的意料之外的和不寻常的模式。该方法通常被用于欺诈检测、时间序列的监测、入侵检测和医学检测中。现有的算法大部分都基于监督的和非监督的学习,其余的使用半监督的方法。然而在大部分实际应用中,没有足够的经过标记的数据用于训练并且经过正面标记的例子也很少。孤立点检测目前正受到来自“维度灾难”的各种高维挑战。目前的主流观点认为高维数据中的距离度量难以度量和计算。这对基于距离的孤立点检测方法构成了巨大的障碍,因为无法标记所有的点。本文提出一个新的基于距