基于Bayes算法的网页文本分类研究

来源 :数字技术与应用 | 被引量 : 0次 | 上传用户:morenedu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet上信息量巨大、信息种类繁多,信息检索具有盲目性及检索结果中冗余信息多。为了使用户能够更加有效的获得自己所需要的信息,本文采用Naive Bayes算法对网页文本进行分类研究。针对网页结构的特点,详细分析网页标识中对分类过程有贡献的结构成分,从中提取特征项,然后应用Naive Bayes算法利用有效的特征项进行分类。降低了互联网信息检索的难度,方便用户准确定位所需信息的目的。
其他文献
自六朝以来,忠孝君亲的儒家伦理早已在道教教义与修道生活中得到内化的融合与体现。初唐政府屡次命令道士僧尼致拜父母与君王的诏令,都将道士女冠与僧尼相提并论,强令二教必须礼
在高中数学教学与数学学习中,作业是较重要的载体之一.随着新课改的不断深入,数学理念及教学方式的改革逐渐成为高中数学教学改革的重要内容.在高中数学教学过程中,作业布置
网络设备的种类繁多,且与日俱增。在计算机网络的组建过程中,常用的网络设备除了计算机之外,还有调制解调器、网卡、中继器、集线器、网桥、交换机、路由器、网关等。