一种基于概率密度的数据流聚类算法

来源 :计算机应用 | 被引量 : 2次 | 上传用户:binzhi0du
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流具有数据量无限且流速快等特点,使得传统的聚类算法不能直接应用于数据流聚类问题。针对该问题,提出了一种基于概率密度的数据流聚类算法。此方法不需要存储全部的历史数据,只需要存储新到达的数据并对其应用EM算法,利用高斯混合模型增量式地更新概率密度函数。实验表明,该算法对于解决数据流聚类问题非常有效。
其他文献
目录共有19类132种产品.自2003年8月1日起,未获得强制性产品认证证书和未加施中国强制性认证标志的产品不得出厂、进口、销售.
大学实验室的典范--卡文迪什实验室在现代物理学的发展中,实验室的建设具有重要的意义.英国剑桥大学的卡文迪什实验室(Cavendish Laboratory)是最早的现代物理实验室.这个实
提出一种改进的快速多分辨率运动估计算法,利用小波的多分辨率特性和小波匹配误差特性,在部分失真消元(PDE)算法的基础上,通过改进搜索顺序、匹配顺序和比较间隔来提高运动估计的速度。实验结果表明:该算法能达到全搜索算法(FSA)的精度,同时有效降低了计算复杂度。
提出了一种新的基于简单多样性规则的改进差分演化算法,并把它运用于约束全局最优化问题的求解中。新算法的特征是:1)提出一种新的混合自适应交叉变异算子,以增强算法的搜索能力;2)采用具有保持群体多样性的约束函数处理技术;3)简化基本差分演化算法的缩放因子,尽量减少算法的控制参数,方便工程人员的使用。通过对13个标准测试函数进行测试,并与其他演化算法结果进行比较。实验结果表明,新算法在求解精度和稳定性具
针对文本聚类所面临的维数灾难、稀疏向量以及标准K-Means算法初始中心点选择的随机性等问题,提出了一种基于概念格的文本聚类算法,且该算法不需要评价函数。实验结果验证了该算法的有效性。
提出了一个基于有限域上离散对数的身份认证和密钥协商体制,该体制不仅克服了传统的基于PKI/CA密码体制的公钥管理复杂性,也消除了CA认证中心带来的通信瓶颈问题。同时,该体制能很好地适用于AdHoc和DPLinux等完全分布式系统环境。对该密码安全体制进行安全分析后表明:该体制能有效地抵御网络中的消息重放攻击和中间人攻击,并在实际应用中有较高的可行性。
基于网络隔离技术,给出了一种网络隔离系统的体系结构。着重阐述了在这一特殊架构下的业务代理模型设计,并说明了在网络隔离环境下的代理模型与一般代理服务器的区别,最后实现了HTTP协议透明代理的功能。
都说时间就是金钱.准确地把握时间当然是把握金钱的首要因素。每天在电脑前工作.看得最多的就是电脑中的系统时间。不过这个时间可不一定准确,它会受到主板电池电量等因素的影响
声乐是一门需要人体器官全程参与和高度配合来完成的一门艺术。因为涉及到中小学音乐课堂上多方面的需求,所以高师音乐专业学生培养中将声乐确立为核心课程。本文通过笔者自
对目标提取结果进行后期修正是进一步提高提取精度的重要举措。针对在前期目标提取算法框架内实现修正困难、局限较多、难于推广等不足,提出了一种基于图割理论的独立修正算法。首先通过人机交互选定修正区域,然后映射成s-t网络,最后运用最大流/最小割算法对s-t网络进行切割得到修正后的目标轮廓。实验表明,该方法不仅操作简便,实时响应,不破坏已有的正确提取结果;而且参数少,抗噪能力强,适用于一般的基于轮廓的目标