论文部分内容阅读
在文本聚类中,聚类的最终结果应该是一棵树的形式.然而,随着互联网的普及,面对海量的电子文献,学科分枝的越来越细化,树的分枝粒度越来越小,逐层聚类必然会花费巨大的时间.本文讨论并提出了针对特定领域扁平聚类和分层聚类相结合的思想,并且对于文本预处理和具有较强实用性的ISODATA扁平算法给出了VC++的实现.