一种适用于数据仓库环境的增量聚类方法

来源 :河北大学学报:自然科学版 | 被引量 : 0次 | 上传用户:kjnojn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析要求较高聚类质量和快速响应能力,各行业数据仓库中的大量、高维数据对算法的效率提出了更大的挑战.CURE算法能够提供高质量聚类结果但不满足联机聚类要求.结合数据仓库数据不定期批量、增量更新的特点,提出了一种新的增量式CURE聚类算法——InCURE,利用对象的互连性和近似度,保持原算法的动态聚类特性的同时大大缩短聚类时间.5维、20维、50维的大量数据实际测试表明无论低维还是高维数据,InCURE都比CURE具有更高的效率,适合数据仓库环境下的增量式聚类分析.
其他文献
环境污染物的生态毒理学研究是目前国内外环境科学领域中的研究热点之一,而对于水体沉积物中环境雌激素对底栖生物的影响研究不多,具有重大深入研究意义.环境雌激素(EEs)进入生物
对非线性二阶积-微分方程边值问题正解的存在性进行了研究,利用锥压缩与锥拉伸不动点定理获得该问题正解的存在性和多个正解的存在性.