一种基于PDStream的增量聚类算法研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:zywlaoying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据流挖掘中非常活跃的研究领域,它根据最大化类内相似性和最小化类间相似性的原则,把相似的对象聚在一起而把相异的对象分离。目前已经提出许多聚类算法来发现不同领域中的聚类模式,但很多聚类算法在聚类请求到来时,都是重新开始对整个数据空间的进行聚类,这就提高了算法的时间复杂度,不能很好的适应实时数据流的高速流动和实时响应用户要求的特点。在实时数据流中,数据流的高速流动及其数据量巨大等特点,要求数据流挖掘算法具有比较快的处理速度和实时响应用户的需求。为了利用已有聚类结果加快聚类速度,提高聚类效率,本文在基于衰减窗口与维度树的实时数据流聚类算法(PDStream)的基础上,提出了一种基于网格和密度维度树的增量式聚类算法(IGDStream)。该算法能够利用前一次聚类的结果,结合当前到达的数据流进行聚类。这种增量聚类是利用密度维度树存储的聚类结果,通过网格的密度更新密度维度树来实现的。该方法避免重新对整个数据流进行处理,以提高挖掘算法的效率。通过多个数据集的实验表明,本研究所提出的实时数据流增量聚类算法算法能够在噪声干扰下发现数据流中任意形状的聚类,并改善了算法的聚类能力。
其他文献
无人机作为现在和未来战场上夺取制空权的主角,其重要性不言而喻,然而它本身的研制生产和后期事物花费都是相当巨大的。计算机仿真技术拥有相对造价低、仿真度高、可重复利用
随着互联网覆盖越来越多的人群,也越来越深入我们生活的各个方面,人们一方面从中获得了许多的便利,另一方面又被爆炸式增长的数据弄得难以决策。因此,我们需要根据用户的个性化需
人类的生产生活对自然环境造成了严重影响,导致雾霾天气出现的日渐频繁。雾天气条件下拍摄的照片模糊不清,对各类视频监控系统的使用带来了不便,因此对图像进行去雾处理,恢复
学位
人工智能是对人的意识、思维的信息过程的模拟。自诞生以来,人工智能理论和技术日益成熟,应用领域也不断扩大。AlphaGo完胜李世石后,人工智能引起全世界人民的关注。作为计算机
自适应均衡是水声通信中广泛采用的消除码间干扰的一种方法。为了适应高速数据传输的要求,达到在非线性畸变信道上较好的抗噪声性能,可采用非线性自适应均衡器—判决反馈均衡
由低分辨率图像生成高分辨率图像的技术称为超分辨率重建技术。超分辨率重建技术作为一种不适定问题,在社会生活的多个方面都有应用价值,包括航天航空、国防军事、医学、遥感图
学位
近年来,GPU及并行计算的发展使得计算机处理数字图像的能力大大提升,计算机视觉已从研究领域逐渐转向应用技术发展。视频目标跟踪是计算机视觉领域的重要研究方向,在国防和民
数据挖掘技术的研究工作,随着近年来数据量的不断增加,并随着社会的迅速发展,获得了不少的研究成果,可以预见数据挖掘技术在农产品价格预测中将会有很大的潜力。论文建立一个