基于Bayes算法的网页文本分类研究

来源 :数字技术与应用 | 被引量 : 0次 | 上传用户：morenedu

【摘要】

：

Internet上信息量巨大、信息种类繁多,信息检索具有盲目性及检索结果中冗余信息多。为了使用户能够更加有效的获得自己所需要的信息,本文采用Naive Bayes算法对网页文本进行

【作者】

：

刘啸啸

【机构】

：

天津工业大学计算机科学与软件学院

【出处】

：

数字技术与应用

【发表日期】

：

2015年12期

【关键词】

：

文本自动分类分类算法特征抽取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Internet上信息量巨大、信息种类繁多,信息检索具有盲目性及检索结果中冗余信息多。为了使用户能够更加有效的获得自己所需要的信息,本文采用Naive Bayes算法对网页文本进行分类研究。针对网页结构的特点,详细分析网页标识中对分类过程有贡献的结构成分,从中提取特征项,然后应用Naive Bayes算法利用有效的特征项进行分类。降低了互联网信息检索的难度,方便用户准确定位所需信息的目的。

其他文献

道教修道生活的忠与孝——以初唐“致拜君亲”论争为中心

自六朝以来，忠孝君亲的儒家伦理早已在道教教义与修道生活中得到内化的融合与体现。初唐政府屡次命令道士僧尼致拜父母与君王的诏令，都将道士女冠与僧尼相提并论，强令二教必须礼

期刊

初唐道教伦理致拜君亲忠孝观国家宗教

数学学科课后作业的有效性研究

在高中数学教学与数学学习中,作业是较重要的载体之一.随着新课改的不断深入,数学理念及教学方式的改革逐渐成为高中数学教学改革的重要内容.在高中数学教学过程中,作业布置

期刊

高中数学课后作业有效性

计算机网络中常用的网络设备简介

网络设备的种类繁多，且与日俱增。在计算机网络的组建过程中，常用的网络设备除了计算机之外，还有调制解调器、网卡、中继器、集线器、网桥、交换机、路由器、网关等。

期刊

调制解调器网卡中继器集线器网桥交换机路由器网关

基于Bayes算法的网页文本分类研究

其他学术论文