度量空间中基于距离孤立点的快速挖掘

来源 :浙江大学学报:工学版 | 被引量 : 0次 | 上传用户:my363
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将数据点的κ最近邻(κ-NN)距离作为孤立程度指标能够有效地发现数据集中的孤立点,但是基本算法需要O(N^2)次数据点间的距离计算,不适用于大数据集.为此提出了一种利用度量空间中三角不等式的快速挖掘算法——提前修剪(ADVP).ADVP利用每次κ-NN查询中保存的近邻点到被查询点的距离计算出近邻点的孤立程度上界.孤立程度上界小于已发现最弱孤立点的孤立程度的数据点可被修剪而无须进行κ-NN查询.基于抽样方法优化了搜索次序以提高修剪效果.同时将ADVP自然地扩展为增量式算法.在标准大数据集上的实验结果表明,A
其他文献
根据苎麻生长所需要的关键性气象因子,主要是光照、温度、降水、风,通过对这些气象要素分析,与平原、湖区苎麻产区相比,分宜丘陵苎麻产区漫射和散射光多、热量温和、水分充足、风
由于生物质来源广泛和含碳量较高,以生物质为碳源合成炭基多孔材料是获得功能炭材料的重要途径。生物质为原料制备炭材料的主要方法有水热法、模板法和化学活化法。这些制备
针对蓄意污染事件下给水管网传感器优化选址问题,提出了以污染事件监测比例最大化、污染事件监测时间期望值最小化和选址方案可靠性最大化为设计目标的多目标优化选址模型.结
超临界水堆的一次通过循环设计不同于现有轻水堆,因此研究其扰动特性十分重要。在发生扰动后欲保持电站运行稳定,就要依靠控制系统调节达到稳定的状态。本文通过FORTRAN编制
在JG P560型高真空多功能磁控溅射设备上,利用直流磁控溅射法,通过控制共溅射时A u靶和Cu靶的功率变化,在平面基片和微球表面制备了一系列成分渐变的Au/Cu涂层,并用扫描电子显微
新课改下的很多课堂都焕发出勃勃生机,学生在学习中主动、积极,有话想说,也有话可说。确实,新课程标准提倡“对话教学”,强调突出了学生在阅读及阅读教学中的主体意义。但这一观念
旅美教育家黄全愈在他的《生存教育在美国》一书中有这样一段叙述:在美国,我最喜欢看的电视节目之一,是黑人笑星比尔.考斯彼主持的《孩子说的出入意料的东西》。
球床水冷反应堆的堆芯为球形燃料元件堆积成的多孔通道,具有显著的强化换热作用。球床通道内的孔隙因具有多变性、随机性的特点,换热情况非常复杂,相关研究较少。为了研究含
为了获得更好的压印质量,对聚合物微热压印成品缺陷产生的原因进行了研究.采用有限元法(FEM)模拟冷却阶段和脱模阶段产生的缺陷,分析结果显示,由于聚合物和模具间不同的热膨胀系数,
为了研究节理细观形态对其宏观力学性状的影响,据岩石节理分形特点,将节理面分解为不同层次细观结构面,节理破坏拟为粗糙度分层渐进破坏的过程,基于Plesha本构建立了岩石节理