【摘 要】
:
作为数据挖掘技术的研究前沿,数据流具有实时连续、高速到达以及动态变化等特点,在如无线传感器网络、金融分析市场、网络入侵检测等众多领域都扮演着十分重要的角色。聚类分
论文部分内容阅读
作为数据挖掘技术的研究前沿,数据流具有实时连续、高速到达以及动态变化等特点,在如无线传感器网络、金融分析市场、网络入侵检测等众多领域都扮演着十分重要的角色。聚类分析作为数据挖掘技术的主要组成部分之一,旨在发现数据中隐藏的簇类知识信息,为用户做出正确的决策提供理论指导。概念漂移检测作为数据流研究中不可避免的问题之一,主要是期望发现数据流模型何时以及因何原因发生变化,从而达到预测数据流趋势的目的。当前的聚类算法主要是在整个数据集上展开的,很难直接应用于数据流上,因此迫切需要设计出可以处理数据流的聚类及概念漂移检测算法。本文针对数据流聚类算法的研究主要分为以下三点:首先通过分析国内外的相关文献,对数据流的研究现状和不足之处进行了综述;其次针对数据流上的聚类任务受到时间和空间限制的问题,本文提出了一种新的数据流模糊聚类算法Weight Decay Streaming Micro Clustering(WDSMC)。该算法使用改进的带权值的模糊C均值算法作为基准聚类算法,并采用微簇结构和权值衰减结构提高聚类质量。实验表明,相比于SWFCM算法和StreamKM++算法,WDSMC算法具有更好的聚类精度;最后本文对数据流中可能会出现的概念漂移现象,提出了在大小可变的滑动窗口中通过度量相邻窗口之间的聚类差异性来判断是否发生了概念漂移并提供相应的解决方案。实验表明算法能够有效地检测出数据流中的概念漂移现象,具有很好的聚类效果和很高的时间效率。
其他文献
图像发排控制技术是在数控技术和计算机技术的基础上发展起来的一种自动化控制技术。该技术综合了嵌入式、机械设计、光学、电子、图像处理等相关技术,以机械速度、位置、扭
基于内容的图像检索是多媒体信息检索领域的一项新兴技术。和传统的基于标注的图像检索方式相比,它具有客观,自动高效等优点,有着非常广阔的应用空间。目前,大多数基于内容的图像
广播加密指加密方通过广播信道,将消息同时发送给收听该广播的多个用户的加密方案,广播加密作为信息安全的重要内容,近年来成为了研究的重点。和传统的广播加密方案相比,基于
双目立体视觉的基本原理是模仿人眼与人类视觉的立体感知过程,从两个视点观察同一物体,得到不同视角下的图像后再通过三角测量原理计算图像像素间的位置偏差,由此获取景物的
图像数字水印技术是随着数字化和网络发展而新兴的一种保护图像版权的技术。它也是信息隐藏技术和数字水印技术里面一个重要的分支。本文是在现有研究理论的基础上进一步探讨
在视频会议、可视电话、防盗监控等领域中,人们往往关心的是人的面部特征,而对背景区域却不是特别感兴趣,此时就没有必要对整个图像采用同样的编码方式,因为若对整个图像进行无
模式匹配问题是计算机科学的一个基本问题。在早期的模式匹配研究中,多数算法集中于精确模式匹配的研究,如:著名的单模式匹配算法KMP、BM及多模式匹配算法CA、CW、BNDM等。但
P2P(Peer-to-Peer)网络,是近些年的主流网络结构。在P2P网络中,节点都是平等的,节点既可以充当服务器的功能也可以充当客服端的功能。正是由于其节点的独有的特性,P2P网络在
虚拟存储技术能够为海量数据提供存储,然而,虚拟存储在现有互联网的应用中面临着存储资源实时监测和虚拟硬盘资源分配等问题,本文在未来网络环境下,研究虚拟存储技术中资源监
随着多媒体技术和网络技术的迅速发展,保护数字作品的版权成为当今学术界研究的一个热点话题。数字水印作为信息隐藏技术的重要研究方向,它在数字图像等多媒体版权保护方面具