文档距离相关论文
随着计算机行业的快速发展,人们获得的信息和采集的数据不断增加。聚类算法作为数据挖掘的一种常用工具,可以有效地分析数据之间的......
为解决传统的K-means算法需要人工确定K值和随机选取初始簇中心容易陷入局部最优的问题,提出自适应簇中心选择算法.首先将任意选取......
广义编辑距离的计算是一个NP-完全问题,在充分考虑了文档抄袭行为的特点之后提出一种基于广义编辑距离的单向的低计算复杂性的文档......