基于标签加权的HTML文档分类算法

来源 :现代计算机:下半月版 | 被引量 : 0次 | 上传用户:hiketty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网的普及.如何有效地分类HTML文档成为一个热点话题。提出一个基于标签加权的HTML文档分类算法,该算法使用词干分析方法进行数据预处理,同时使用LSI对特征向量降维。然后使用人工神经网络反向传播算法作为主分类器。通过实验表明,对HTML文档的标签加权.有助于提高分类的准确性。
其他文献
在基于基础设施即服务(Infrastructure as a service, IaaS)的云服务模式下,精准的虚拟机能耗预测,对于在众多物理服务器之间进行虚拟机调度策略的制定具有十分重要的意义.针
针对高等职业教育计算机教学过程,分析课堂教学的实际情况,提出教学用事例的特点和选择依据。阐述在计算机课程授课时,使用教学用事例需遵循简单明了、贴近实际、化难为易、加强
介绍基于Windows CE平台下的空降部队快速集结系统的开发。包括整个系统的组成以及软硬件平台的结构,通过PB软件对嵌入式Windows CE操作系统内核的定制,并应用VisualStudio 2008开发GPS定位、无线通信应用系统软件,实现空降部队快速集结系统各项功能。经过测试,基于Windows CE平台下的空降部队快速集结系统能够准确获得GPS信息,定位误差和响应时间均能满足设计要求。
介绍一种利用C8051f系列单片机和电流控制型PWM控制器SG3525,设计并研制的一种中频感应加热电源控制线路,分析采用C8051f330单片机控制SG3525实现高压脉冲加热启停和频率测量,加热时间设定以及设计主回路过温过压等保护功能。
通过长期计算机教学工作.总结出如何在计算机教学中有效激发并保持学生的计算机学习兴趣的几种方法,以求最大程度地调动每一名学生学习计算机的积极性,进而提高教学质量。