论文部分内容阅读
k-NN,即k最近邻居法,是一个被广泛使用的学习算法,也是最基本的基于事例的学习方法。该文针对超文本结构中的结构特征,提出了用k-NN方法利用超文本页面中的文本信息和结构信息进行超文本分类的方法,并用Naive Bayes方法协调两个分类超文本网页。实验验证,综合分类器的分类正确率明显好于基于k-NN方法的文本分类器和结构信息分类器单独分类超文本时的效果。