论文部分内容阅读
给出了一种基于语义概念的高效中文文本聚类方法,该方法是从文本的本身出发,利用《现代汉语语义分类词典》的级类主题词,在高维的文本向量集中提取概念元组,形成表示聚类结果的高层概念,最后基于这些高层概念进行样本划分,从而完成整个文本的聚类过程。试验结果表明,该聚类算法有较好的聚类结果且有较高的执行效率。