【摘 要】
:
基于网格的聚类算法可以高效处理低维的海量数据.然而,对于维数较高的数据集,生成的单元数过多导致算法的效率较低.CD-Tree是一种只保存非空单元的索引结构,基于CD-Tree设计
【基金项目】
:
国家自然科学基金项目(60473073,60573090),辽宁省自然科学基金项目(20052006),辽宁省教育厅攻关计划基金项目(05L354)
论文部分内容阅读
基于网格的聚类算法可以高效处理低维的海量数据.然而,对于维数较高的数据集,生成的单元数过多导致算法的效率较低.CD-Tree是一种只保存非空单元的索引结构,基于CD-Tree设计了新的基于网格的聚类算法,利用CD-Tree的优点提高了传统的基于网格的聚类算法的效率.此外,该算法聚类时只需访问稠密单元,设计了优化策略,在聚类之前剪枝掉非稠密单元,进一步提高了算法的效率.实验表明,与传统的聚类算法相比,基于CD-Tree的聚类算法有更好的可伸缩性.
其他文献
多媒体处理经常包括许多乘加操作.给出了一种新型的适用于多媒体处理器的MAC单元的设计,它用两个8b×8b的乘法器来完成3种不同字长情况下的乘加操作:第1种情况是16b×
多吃醋,爱吃醋,是否对人体健康有益呢?食品专家认为,醋酸具有促进新陈代谢的功效,可帮助消化,消除疲劳,预防动脉硬化、高血压.日常生活中有技巧地使用醋作为调味料来进行食物
<正> 启东市有长满大米草的高潮区淤泥质滩涂3万多亩,而且每年都以一定的速度向外延伸。为了充分开发利用这块滩涂,我们于1997年开始进行低坝高网蓄水养殖锯缘青蟹和三疣梭子
根据GenBank登陆的新城疫病毒P基因序列。设计了一对引物。用RT—PCR技术对新城疫病毒内蒙古分离株TL1的P基因进行了扩增。将扩增产物提纯后克隆入pGEM—Teasy载体,通过酶切、