论文部分内容阅读
文本聚类是聚类的一个重要的研究分支,是聚类方法在自然语言处理领域的具体应用。研究表明事件在大量的文本中是客观存在的,诸多文本是由事件组成的,事件是文本表示的最小语义单位。探讨了以事件为特征的文本聚类方法,首先给出了基于事件的文本概念格表示模型,在此模型的基础上,给出了文本相似度的计算方法。最后,使用K-means聚类算法对所提方法进行了实验验证。