基于最近邻优先的空间例外挖掘算法研究及应用

来源 :云南大学 | 被引量 : 0次 | 上传用户:wangluochg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
例外挖掘是数据挖掘中的一个重要研究方向,它往往可以帮助人们发现一些真实、但又出乎意料的有用的知识。在数据挖掘的许多应用中,挖掘例外数据比挖掘正常数据具有更高的价值,对发现高质量的知识有更重要的意义。 空间数据是近年来一类快速发展的、广泛存在的、重要的复杂数据,对空间数据的存储、处理和挖掘越来越受到人们的广泛关注,因此,对空间数据进行分析具有重要意义。其中,针对空间数据的例外挖掘研究随着数据挖掘技术的发展显得日趋重要而有意义。本文的研究目的就是希望从空间数据集(库)中挖掘出与其他空间数据明显偏离的,不一致的数据——空间例外数据。本文主要内容由以下几部分组成: 首先,介绍数据挖掘的基本概念、数据挖掘技术的研究背景和发展现状,并详细介绍了空间数据挖掘的概念、特点和分类。然后对例外挖掘的基本概念、方法和各自的特点进行了讨论。 其次,在参考现有空间例外定义的基础上,通过一些具体的、现实中的例子来说明现有的空间例外的定义,针对这些定义存在的不足之处,提出了一种较为全面的空间例外定义,即把空间例外分为基于非空间属性和空间属性两类,并为不同类型的空间例外给出了相应的形式化定义。 第三,在分析了现有的空间例外挖掘模式的基础上,设计了符合定义的空间例外挖掘算法——基于最近邻优先的空间例外挖掘算法,并对算法的复杂性进行分析;提出了一种基于协方差和相关系数的多属性空间例外挖掘算法,实验证明算法可以挖掘出定义的空间例外数据。 最后,将提出的空间例外挖掘算法应用到“三江并流”空间数据中进行试验,验证了算法的正确性和有效性,并将算法与相关文献提出的属性加权算法进行正确性和有效性的比较。
其他文献
随着知识经济时代的到来,人类社会正在经历深刻的变革,人力资源管理已成为企业竞争的根本,人力资源管理成为决定一个企业是否具有竞争力的主要因素,世界各国对人力资源的重视程度
随着信息技术和网络技术的不断发展,嵌入式产品越来越广泛地应用到科学研究、军事工业和消费电子等行业。但实时性能作为嵌入式系统最重要的特性,却严重制约着嵌入式系统在某些
随着信息技术的发展和微型计算机的普及应用,计算机已成为目前应用最为广泛的信息处理和信息传输的电子设备。但是,由电子设备自身所造成的电磁辐射也不容忽视,计算机系统始终都
短距离非视距紫外光通信基于两个相互关联的物理现象:一是大气层中的臭氧对波长在200nm到280nm之间的紫外光有强烈的吸收作用,这个区域被叫做“日盲区”,到达地面的“日盲区”紫
人体运动仿真技术是一种对人体运动进行建模、分析和仿真的前沿技术,在人体运动生物力学分析、逼真人体动画制作、辅助体育训练等领域起着重要的作用。本文以仿真人体复杂空中
关于如何有效应用文档在国内外已经成为一个专门的研究课题,每年ACM都举行文档工程大会,征集和发表文档工程领域高水平的论文,探讨文档工程领域的最新研究理论,研究成果。  本
计算机硬件和技术的不断发展,特别是内存容量的不断扩充、CPU速率的不断提高、体系结构的不断完善,给数据库带来了机遇也带来了挑战。内存数据库比传统的磁盘数据库具有更快的
随着经济高速发展和人民生活水平快速提高,当前机动车数量急剧增加。为了解决交通安全、交通堵塞及环境污染等难题,人们提出了智能交通系统。智能交通系统(ITS)是采用先进的信
蚁群算法是一种最新发展的模拟昆虫王国中蚂蚁群体觅食行为的仿生优化算法,该算法采用了正反馈并行自催化机制,具有较强的鲁棒性,优良的分布式计算机制,易于与其他方法结合等优点
对空间CCD相机的评定主要是通过地面的各种检测设备的反复测试和试验进行保证。结合仿真技术与测试技术,依据空间CCD相机电性接口的分布,建立了地面仿真测试模型,提出了仿真测试