基于贝叶斯的文本分类方法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:shanghairenxuchenhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类中的两个关键问题,算法和特征提取。贝叶斯算法是最有效的文本分类算法之一,但是属性间强独立性的假设在现实中并不成立,借鉴概率论中的多项式模型提出了一种改进型的贝叶斯方法;传统的特征抽取方法有词频法、互信息法、CHI统计、信息增益法等,然而上述方法对于词条的权重未作考虑,引进了权重的表征方式,给出了改进方法,由实验证明了通过以上方面的改进,文本分类的正确率得到了提高。
其他文献
国家科技部部长徐冠华近日在接受媒体采访时,阐述了在信息时代,信息安全对于国家安全的重大意义,并对我国信息安全产业和技术发展进行了展望。 徐冠华指出,国内信息安全技术及产业的发展水平,将最终决定我国国民经济和社会信息化的成败。与国际先进水平相比、与国家信息安全提出的要求相比,国内信息安全技术和
期刊
本刊讯 9月24日,2002年中国计算机病毒疫情发布暨中国计算机病毒防治技术论坛在天津举行.
本文主要介绍信息系统安全保护等级评估的背景及国外相关研究进展,提出系统评估中的关键问题和技术,阐述信息系统安全保护等级评估方法和评估工具的实现,并对评估流程进行描述。
LSI公司日前宣布推出Axxia媒体加速器,这是一款旨在加速新一代富媒体服务视频处理能力的PCI Express卡。该款基于业经验证的LSI SP2704 StarPro多核媒体处理器的加速卡以及配
针对网络多媒体系统的实时应用需求,对Linux2.4核心进行了改造.首先通过集成3种实时调度算法改造了Linux核心的调度模块,使其可以分类处理不同的实时任务;然后改进了中断、时
介绍了税控收款机中数据保护的处理方法,其中详细分析了uClinux下文件系统YAFFS的实现机制,并完成了它的移植工作,也介绍了Flash卡的选用情况,然后论述了系统对于掉电保护的
利用VC++与Fortran联合编程开发航海计算软件具有重要的实用价值。在研究现有的联合编程方法基础上,提出了一种基于外壳同步调用方法和文件交换的方法。研究了这种方法涉及到的
各位嘉宾,大家好!非常高兴能有机会和亚太地区的诸位市长、首席信息官员、各位特邀观察员以及信息产业界的各位代表相聚在中国上海,研讨有关信息时代和推进信息化建设的共性
期刊
一、自主创新对我国半导体产业持续增长具有十分重要意义随着经济和科学技术的不断发展,以半导体产业为核心的电子信息产业在国民经济发展中起着越来越重要的作用,成为各国经济
小型跑码场最好建在城市近郊,不用占用好地,面积1公顷左右的荒坡荒地就足够了,附近要有工作间,可供改建成办公室和马厩。马匹可到北京、河北、内蒙等地去购买.