基于空间拓扑关系的离群检测算法研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:aonHdt6b
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离群检测是数据挖掘的基本任务之一,其目的是要消除噪音或发现潜在的、有意义的知识。空间离群检测是空间数据挖掘的重要内容,发现空间数据中与其他对象不一致的对象,即空间邻域中属性与其它对象明显不同的空间对象。离群数据的探测和分析是一项非常有意义的数据挖掘任务,在国内外得到了广泛的关注,并被应用到诸多的领域中。   GML是Intemet环境下的地理信息表示和传输的标准,大量的空间数据信息以GML格式存储和传送,面向GML的数据挖掘具有重要的理论意义和实际应用价值。   现有的空间离群检测算法都侧重于考虑单个数据对象的属性特点进行离群分析,而没有考虑具有包含、相邻等空间拓扑关系构成的空间对象群的综合特性分析。本文研究了空间拓扑关系下的离群检测问题,取得的成果如下:   1.在分析空间拓扑包含关系时,首先给出了拓扑关系分析中的相关定义以及判断对象包含关系的算法,在这基础上提出面向GML的提取面包含关系的算法。进一步讨论了面对象之间相互影响的拓扑属性的相关思想和计算方法,提出了空间对象之间相互影响的拓扑属性的计算算法,这为后续的离群分析提供了支持。   2.提出了拓扑包含关系中离群面的检测算法DOR_IR,把面包含的对象看作面对象的属性,采用基于关联的方法,根据被包含对象的属性建立面对象的关联连接集合,相应于“噪音”的面就是离群面。对算法DOR_IR进行测试,实验结果表明算法DOR IR在对基于拓扑包含关系的离群面分析有效。   3.提出了拓扑包含关系中局部离群面的检测算法DLO_IR。空间属性一方面用于计算空间对象的拓扑包含关系;另一方面用于计算每个面与邻域面相互影响的空间拓扑属性,由此得到每个邻域面在邻域集合中所占的比例因子。基于比例因子与非空间属性计算每个面的局部离群系数,并以此找出符合离群阈值条件的离群对象。对算法DLO IR进行了测试,实验结果表明算法能够挖掘基于拓扑包含关系的离群面,在实际应用中也是有效的。
其他文献
Voronoi图作为空间离散划分的基本几何结构单元,是计算几何领域重要的研究方向之一。Voronoi图因其垂直平分的特性,特别适用于利用有限体积法求解如液体间流动、热传导等具有某
随着网络、通信技术的不断发展,我国高等院校普遍建立了自己的校园网络,特别是随着我国在科技人才的培养和教育资源方面的深度投入,数字化校园的建设日渐成为各大高校的主流
随着工业现代化和互联网信息化进程的不断推进,精准快速有效的信息搜索技术在机械产品变型设计中显得特别重要。资料数据统计显示,在三维CAD新产品开发设计中,约40%是直接重
Internet上数据量急剧膨胀使其成为企业竞争情报获取的重要来源,然而如何从这个信息海洋中找到企业所需要的情报成为困扰企业竞争情报获取的难题。商业信息抽取作为解决这一
命名实体、术语的翻译对自然语言处理,机器翻译性能的影响越来越重要。在机器翻译领域,双语翻译词典是重要的翻译资源,但是传统的基于词典的方法很难提供大量的,实时的术语的
提高运动流体的可视化效果与效率是近年来科学研究、工程项目、电脑游戏、影视作品、视觉仿真等各个领域最热衷,最具挑战性的课题之一。本文提出一种将非线性的Catmull-Rom插
随着汽车工业的发展,人们对汽车的环保、安全、通信质量和舒适度等方面的性能要求不断提高。同时,应用于汽车上的电子电控单元(electronic control unit,ECU)的数量也越来越多,汽
随着信息技术的不断发展,人们对移动通信的需求越来越强,无线通信网络也得到了迅速的发展和普及。但对于某些特殊的场合,传统固定网络和需要预先部署网络基础设施的无线网络
随着网络B2B的发展,网上购物逐渐成为一种新兴的消费形式,它使人们在不同的时间、不同的地点进行高效的网络B2B成为可能。   目前,网络上积累了大量Web商品资源,但存在对W
网络仿真实验测试床(Network Emulate Experiment Testbed)在国内尚属首例。本文是在参与国家大型网络仿真实验测试床项目基础上完成的。   网络仿真实验测试床是使用仿真