分布式数据流聚类算法及其基于Storm的实现

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:opou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高数据流聚类算法的效率,设计并提出了基于质心距离和密度网格的数据流聚类算法-CDD-Stream,并通过对其中网格结构的更新实施了并行化策略,进而设计并提出了一种分布式数据流聚类算法-DCD-Stream(Distributed Centroid Distance D-Stream)。该算法分为在线和离线两个部分,在线部分实时接收数据流,利用局部节点和全局节点实现了网格结构更新的并行化,完成了整体网格结构的增量更新;离线部分基于网格结构的更新结果进行全局聚类,并存储网格帧,供用户查询历史簇。充分利用
其他文献
当前广泛用于空基任务电子系统的二维态势显示只能显示单一维度信息,并且当态势中存在大批量目标时,无法表达目标在高程空间的分布,目标重叠严重,不能有效识别目标。三维场景渲染
2019年政府新会计制度开始实施,在该政策实施之后,我国行政事业单位的内部控制工作需要进行调整,做好新旧会计制度的衔接工作。而作为具有公益属性的医院,对于内控管理也需要
随着信息技术的发展,人类已经进入了大数据时代,在海量的数据中发掘信息的潜在价值。政府拥有大量权威的信息资源,大数据的发展对政府的信息资源共享建设也产生了一定的影响