论文部分内容阅读
Internet上信息量巨大、信息种类繁多,信息检索具有盲目性及检索结果中冗余信息多。为了使用户能够更加有效的获得自己所需要的信息,本文采用Naive Bayes算法对网页文本进行分类研究。针对网页结构的特点,详细分析网页标识中对分类过程有贡献的结构成分,从中提取特征项,然后应用Naive Bayes算法利用有效的特征项进行分类。降低了互联网信息检索的难度,方便用户准确定位所需信息的目的。