【摘 要】
:
朴素贝叶斯(Na(I)ve Bayes,NB)是一种经典的机器学习算法,它具有训练时间短,模型简单,泛化正确率高等优点,并且在实际生活中得到了广泛的应用。但它也有先天的不足:不能很好
论文部分内容阅读
朴素贝叶斯(Na(I)ve Bayes,NB)是一种经典的机器学习算法,它具有训练时间短,模型简单,泛化正确率高等优点,并且在实际生活中得到了广泛的应用。但它也有先天的不足:不能很好的拟合训练数据局部分布特征,生成参数学习算法不太适合分类任务等。
局部加权朴素贝叶斯(Locally Weighted Na(I)ve Bayes,LWNB)是朴素贝叶斯的一种较好的改进,判别频率估计(Discriminative Frequency Estimate,DFE)可以极大的提高朴素贝叶斯的泛化正确率。受LWNB和DFE启发,提出收缩空间(Gradually Contracting Spaces,GCS)判别学习朴素贝叶斯参数算法:对于一个待分类实例,寻找包含全体训练实例的全局空间的一系列逐渐缩小的子空间,这些子空间具有下列两种性质:1、它们都包含待分类实例;2、一个空间一定包含在任何一个比它大的空间中。在逐渐缩小的空间上使用修改的DFE算法渐进的学习朴素贝叶斯NB的参数,使用NB分类给定的待分类实例。与LWNB的根本不同是:GCS使用全体训练实例学习朴素贝叶斯并且GCS可以实现为非懒惰版本。本文实现了GCS的决策树版本(Decision tree version of GCS,GCS-T),GCS-T是非懒惰算法,它使用决策树寻找子空间。实验结果显示,与C4.5以及贝叶斯分类算法Na(I)ve Bayes,BaysianNet,NaYve Bayes Tree(NFBTree),LWNB,Hidden Na(I)ve Bayes(HNB)(无论这些算法使用判别或生成方法学习参数)相比,GCS-T具有较高的泛化正确率。并且GCS-T的分类速度明显快于LWNB。
其他文献
叶片是植物、作物最重要的器官之一,在呼吸、光合、蒸腾以及养分转化等方面有着不可替代的作用。通过检测叶片的含水率,可以掌握作物的生长状态,为灌溉、施肥等生产管理提供
在2G时代,由于网络速度比较慢,特别是无线网络,稳定性比较差,对于一些欠发达地区来说更是如此,然而恰恰正是这些地区相对缺乏网络维护的技术人员,远程控制技术的出现可以很好
随着科学技术的发展与创新,信息技术及计算机技术给社会带来极大的进步,数据库的信息量也随着增长,形成了大量多元化数据,并蕴含丰富的信息。数据挖掘便是一种能够快速有效的
IB方法旨在将数据对象压缩到一个预先定义好的“瓶颈”变量中,同时极大的保存另一数据对象的相关信息,发现数据对象中隐含的结构模式。IB方法具有严密的理论基础,已经在海量
随着港口物流的迅速发展,港口作为物流、信息流的集散中心,港口的水陆枢纽地位得到不断提高。在市场竞争日益激烈的情况下,港口面临各种挑战。目前,港口数量多且分散,各个港口的经
3G通信技术与网络音视频技术的迅猛发展和成熟,使大数据量的视频监控成为可能,并逐渐应用到各行各业。当前,平安城市、平安校园、平安小区的建设如火如荼。随着视频监控规模的扩
随着因特网技术、无线通信技术和微机电技术(Micro-Electro-Mechanism System, MEMS)的高速发展,无线传感器网络在世界范围内引起了广泛的关注,被认为是会对人类未来的生活方
随着电信企业信息化的浪潮,为终端用户提供满意的服务质量,不同区域运营商的信息互通、数据共享显得尤为重要,而数据集中带来的性能问题日益明显。中国电信OSS应用采用Oracle10g
虚拟装配作为虚拟现实技术在产品设计领域的一种典型应用,其应用价值已经引起了越来越广泛的重视。传统的虚拟装配系统由于多数采用鼠标和键盘作为交互设备,普遍存在交互的沉
Internet问世以来,作为其主流应用的电子邮件也得到了飞速的发展。但随之而来的垃圾邮件,不仅严重占用网络资源,威胁网络安全,更对人们的日常生活造成了严重困扰。当前反垃圾