FODU:不确定数据集中快速离群点检测方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:haojian19831212
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离群点检测是数据管理领域中的热点问题之一,在医疗诊断、金融诈骗、环境监测等领域中具有广泛的应用。目前,随着传感器等设备在数据采集方面的应用,人们发现数据的不确定性普遍存在。与确定性数据相比,挖掘出不确定数据集中潜在的富有价值的信息变得十分困难。针对上述问题,本文提出了一种快速的不确定离群点检测算法FODU(Fast Outlier Detection Approach on Uncertain Data Sets)。首先,本文采用分层次划分思想给出了索引的构建策略,这种索引结构不仅克服了传统索引对多维数据管理的局限性,而且能够被快速地进行空间剪枝;其次,为了快速地挖掘出不确定离群点,本文提出了高效的过滤方法。该方法通过批量过滤与单点过滤两个过程减少了大量的冗余计算,从而提高了检测效率。然后,为了避免可能世界的空间膨胀,给出了数据对象离群概率值的计算方法。最后,通过实验验证所提算法的有效性。实验结果表明,相对于现有研究,该算法可以显著提高不确定离群点的检测效率。
其他文献
探讨了超滤清洗的工作条件和清洗剂的选择组合,结果表明,理想清洗方案为清洗温度48~50℃,膜的进出口压力分别是4.0×10^5、1.9×10^5Pa,依次使用浓度为2%~2.5%的阴离子表面活性
农村居民点是农村人地关系的表现核心。由于地貌环境的差异,农村居民点在形态、布局等方面呈现多样化特征,把握农村居民点的内在特征与变化规律,有助于提升农村规划建设的科
通过空间结构(规则格子、连续平面和复杂网络)框架中的空间演化博弈研究,揭示无偏向的迁徙行为对于合作究竟起何作用.研究发现:迁移对于合作起一种普遍的作用,无论其空间结构
针对二次流体量热器法测压缩机性能时,温控仪表对载冷剂温度的控制存在超调量大、稳态误差大等问题,研发了一套可进行探索性实验的电子膨胀阀测控系统。采用控制精度高的电磁
五卅运动期间,瞿秋白不仅直接领导了反帝爱国运动,而且写了大量文章,为五卅运动指明了斗争的方向和目标,提出了斗争的策略和方针,并在五卅运动后,及时总结经验教训,高度评价
提出了由铅氧化成氢氧化铅、碱式碳酸铅 ,与醋酸反应生成醋酸铅再通入二氧化碳反应生成碳酸铅 ,经灼烧制红丹的新工艺。克服了原工艺能耗大、产生大量有毒废水及有毒粉尘等缺
在自然界和人类社会中,合作行为是普遍存在的.如何理解自私个体之间合作行为的产生和维持吸引了来自各领域科学家的注意.目前,演化博弈理论被认为是研究合作行为的一个最有力
小型制冷压缩机性能测试系统中蒸发温度的传统控制方式存在精度低和温度波动大等问题,而蒸发温度控制的精度又直接关系到制冷量的测量精度。为了实现对被测压缩机制冷量的测
采用一氯乙酸与不同分子量的聚乙二醇发生酯化反应,合成了一系列端基含有活性氯的氯乙酸聚乙二醇酯,并采用正交实验法确定了酯化反应的优惠工艺路线。实验表明,在温度为80℃,