一种基于加权的ID3改进算法

来源 :第十九届全国网络与数据通信学术会议 | 被引量 : 0次 | 上传用户:tomzhang155
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在机器学习领域中,决策树是一个很重要的问题.决策树作为一种工具已经应用在了很多领域中.虽然对决策树的研究已经十分广泛,但是在决策树的分类算法中仍然存在一些不足之处,例如使用信息增益作为分类准则会造成“多值偏向”问题的出现.在决策树算法中,ID3算法就是一种基于信息增益的算法,它作为决策树的核心算法,可以扩展到其他决策树算法中去.为了优化决策树分类算法,这篇文章提出了一种对于ID3算法的新型决策树分类扩展算法,称为ID3-α.ID3-α引入一个特别的权值来平衡属性值对于数据的不平衡程度.实验表明这种新型的算法在分类问题上的表现要比ID3算法精确,并且这种加权思想也可以用在其他决策树算法中.
其他文献
随着科技的迅猛发展,能源消费急剧增长,供需矛盾日益突出。能源问题已经成为中国经济社会持续发展的最大制约,直接威胁国家经济安全。传统的能量感知和管理主要通过全人工方式实现,人力、物力、财力均消耗过大。提出了一种基于物联网的能量感知和管理系统的层次模型,讨论了能量感知、控制、管理、通信等技术,最后分析了实际案例。作为一种新型信息系统,物联网能量感知和管理系统借助现有的传感、通信、计算机技术,可实现能量
将量子计算引入图像处理是目前解决图像处理高精确度和高实时性等性能难题的重要手段。研究主要从量子计算的基本原理出发,介绍了目前4种已有的量子图像存储技术研究,并分析了其与经典数字图像存储方式的异同。通过性能对比,对4种量子图像存储方法的优缺点进行了定性分析,并提出一种改进的基于量子叠加态的图像存储机制的设想。研究综述了量子图像存储技术的发展现状和未来的研究趋势,对量子图像处理领域的后续研究有重要的指
随着神经工程学的兴起,大量的研究出现在神经网络的模拟领域。虽然对于神经网络模拟器的研究越来越受到重视,但基本的关于模拟器评测的问题却未能有一个系统的解决方案和评价手段。对神经网络模拟器现有的评测方法进行了总结。同时创新地从性能、精度等多个方面通过对spike次数、ISI、spike时间差异等指标进行具体分析,给出评价理论依据。结合评价理论,提出了一种评测方法,对GENESIS、NEURON等多个模
主要介绍SOC音频系统级演示验证系统的构建,将SOC音频系统演示系统划分为硬件系统和软件系统,并对各系统的构成模块以及功能作用做以介绍。硬件系统部分由音频数据的采集、传输和处理3个基本模块构成,介绍了各模块部分之间的联系和功能。软件系统部分主要介绍验证系统的软件组成和验证平台的构建,以及采用的验证方法。
传感器节点通常由容量有限的电池供电,能量的有效利用进而延长网络生命周期是传感器网络需要解决的关键问题,现有的拓扑研究方法中的广播方式采用的是全网广播,无疑源节点对目的节点反方向的广播是对能量的不必要的消耗,而利用对传播范围的划分,实现在路由发现过程中的定方向广播,从而在一次对邻居节点的定向广播中对广播角度节省达到67%,在多次寻找节点的过程中会成倍地节省能量,无线传感器网络主要能耗集中在通讯方面,
云计算是近年来提出的一种基于互联网的新型计算模型,这种模型简单来说就是将多种类型的计算资源(计算能力、存储、网络和软件等)通过虚拟化等技术抽象化后以服务的方式提供给用户,使用户可以通过浏览器等软件或者其他Web服务来访问,而软件和数据都存储在服务器上。云计算使得用户不再需要了解“云”中基础设施的细节,不必具有相应的专业知识,也无需直接进行控制。通过这种方式,共享的软硬件资源和信息可以按需提供给计算
服务组合是服务计算的核心问题,而服务组合的正确性与可靠性则是服务正确执行的前提保证。首先提出了一种基于Alloy的服务组合验证的方法,该方法通过有限状态机来建模WS-BPEL业务流程的状态变迁,采用Alloy语言对需要验证的属性进行描述,使用Alloy模型完成有限状态机的形式化,最后使用Alloy Analyzer分析组合服务是否满足属性要求。通过实例研究表明,提出的基于Alloy的服务组合验证方
库函数识别技术是反编译过程中一个重要组成部分。全面研究了静态库函数和动态库函数的识别技术,详细研究了静态库函数识别的关注点、难点,结合标准库、专业库和用户库各自的特点,对静态库函数的识别过程进行了分析与探讨;根据动态库的特点,对使用了一般调用方式和特殊调用方式的动态库函数识别方法进行了简要的论述,最后对库函数识别技术进行了分析总结与展望。
飞行仿真软件在信息化战争中发挥着重要的作用,不合理的飞行仿真软件设计方法会产生重复劳动、系统复杂度高、实用性差等负面作用。现有的飞行仿真软件设计方法只考了控制律的设计而忽略了系统架构的设计,本文提出一种基于分层架构的飞行仿真软件设计方法,将控制律的设计和系统架构的设计有机结合起来。我们将飞行仿真软件的设计划分为任务层设计、决策层设计、控制层设计和执行层设计;将航迹和姿态控制、动力学方程解算、飞行决
聚类分析是数据挖掘的一个重要研究领域。它在商业、生物、医学、地质、web文档等方面都有重要的应用,是当前的研究热点问题之一。本文在信息熵理论和蚁群算法的基础上,设计了一种新的融合算法——基于信息熵的蚁群聚类,应用到代表性子集选择中,可显著降低I/O耗费和内存需求,实验证明这一算法能有效地处理含有分类属性的高维大规模数据集的聚类问题。