论文部分内容阅读
分析了文本分类挖掘的一般特点,即数据密集、计算密集,讨论了网格技术对文本分类的支持。为适应网格环境,对文本特征向量的权重确定算法作了调整,提出了基于词频、词语首现位置、词语长度的单文档综合平衡权重算法。最后,构建了一个基于桌面网格的并行文本分类系统,并进行了对比实验。实验结果表明该系统是可行的、有效的。