基于粗糙集的高维空间离群点发现算法研究

来源 :暨南大学 | 被引量 : 0次 | 上传用户:wrc_166
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离群点发现是数据挖掘的一项重要技术。本文提出了对高维空间下离群点挖掘技术上的一个改进,即利用粗糙集的约简特性对高维空间下的数据属性进行约简,通过约简一些无关紧要的属性来减少高维空间的维数。然后在各个关联规则的子空间下对数据集进行基于密度的离群点挖掘,从而使高维空间下的离群点挖掘更具有实用性。基于密度的离群点挖掘算法对计算数据的k-最近邻采用二分法,较大减小了时间复杂度和空间复杂度。数据分析表明,该算法能有效地发现高维空间数据集中的离群点。
其他文献
该文密切围绕水下目标识别这一核心问题,以实际工程应用为背景,主要采用时频分析与非高斯信号处理方法,对水下目标特征提取和分类算法这两个关键环节,展开了下列研究工作:(1)
世界经济的平稳增长以及机动车价格的大幅度下跌导致了最近几年机动车的私人拥有量在不断的上升。而我们在享受机动车带来的便利的同时,交通事故的增加也在困扰着我们。故此,
随着信息技术的迅猛发展,各个部门积累了海量数据,迫切要求从这些数据中自动地采掘有价值的信息和知识以支持决策。于是数据采掘技术应运而生。关联规则采掘是数据采掘中的一个
该文分析并比较了各种基于树结构的多维数据分布方法,给出了基于k-d树结构的分布方法的详细设计方案,指出设计基于传统索引结构的数据分布方法是解决并行数据库系统数据分布
该课题主要研究以对象数据库为后台的在线服装博物馆系统模型的特征、功能和结构.借助该实验室网络数据库研究所已经成功完成的"服装文化多媒体数据库"课题项目,该课题在理论
该文讨论了软件内建自测试中类测试模板的设计与实现.类测试模板是面向对象软件测试模板中最基本的测试模板,它通过各种前台界面和分析模块收集生成类测试用例需要的信息并存
web上有海量的数据信息,怎样对这些数据进行应用,成了现今数据库技术的研究热点,数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题,充分利用有用的
本论文主要的研究内容是基于隐马尔可夫模型的说话人识别的改进和应用。说话人识别是根据人的声音来识别人的一种生物认证技术,有非常好的前景。而隐马尔可夫模型则是在说话人
该文首先分析了人工服务难以建立统一应用逻辑规则的特点以及iCALL系统的特征,提出有限状态机建模的可定制流程机制以实现人工服务的可定制性.可定制流程机制的框架结构主要
Ad hoc网络作为一种无中心、自组织网络,因其不需要现有信息网络基础设施的支持,能够适用于战场、灾害、临时会议等特殊场合而成为研究热点。由于使用无线链路,分布式控制,网