数据挖掘技术中分类算法的比较分析

被引量 : 0次 | 上传用户:liangxinnet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题是数据挖掘技术中的主要研究课题。分类是根据数据集的特点构造一个分类器,利用分类器对未知类别的样本赋予类别的一种技术。目前的分类算法主要有统计分类法、决策树、神经网络等。不同的分类方法会产生不同的分类器,分类器的优劣直接影响数据挖掘的效率与准确性。因此,当对大规模的海量的数据进行分类时,选择最有效的分类算法是至关重要的。目前关于数据挖掘的分类算法研究类型可以概括为以下几种:分类算法的综述型;对分类算法的改进型;将某些分类算法进行组合;在小样本条件下的分类算法的实证研究;对某一单一的分类算法的研究与应用型。特别是目前大部分研究者倾向于提出新算法,很少有对算法的使用进行实证分析和比较,对某一具体数据集运用已有的各种分类算法进行对比研究的尚不多见。为弥补这一不足,本文利用多个具体实例,对数据挖掘中的分类问题进行了深入的研究,分析比较各种算法的特性,找出各自的特点。经对比分析,认为神经网络算法的总体分类效果较好。同时在对比分析中,还发现在对于不同类型的数据集,不同领域的数据集,不同的分类模式,不同的比较准则,不同的分类方法都会产生不同的分类结果。因此在对于不同的数掘集进行分类时,必须依据数据集自身的特点和分类的模式选择不同的分类方法,这样才能把误差控制在最小的范围,得到高精度的分类结果。
其他文献
电气化铁路作为我国重要的运输工具之一,具有污染小、功率大,能源综合利用率高等特点,因此在各国都得到广泛应用。目前我国的电气化铁路获得迅速发展,现已达到2万公里,承担运量近5
从体内和体外两个方面综述国内外文献中关于肺部给药的研究方法,探究其作用原理,并报道相关应用实例。概括出的体外方法主要包括沉积行为的局部模型、整体模型和数学模拟3大
笔者受《素问·经脉别论篇》"食气入胃,散精于肝,淫精于筋。食气入胃,浊气归心,淫精于脉,脉气流经……行气于府,府精神明,留于四藏";"饮入于胃,游溢精气,上输于脾,脾气散精,
随着国际服务贸易浪潮的兴起,各国经济竞争的重点已经由货物贸易向服务贸易进行了转移。中国、日本、韩国也日益重视服务业的发展,并将服务贸易作为促进经济增长的重要推动力。
社会保险是现代政府的重要职能之一,也是现代社会的“稳压器”,近年来备受社会关注。社会保险历经百余年的发展,一些发达国家的社会保险制度已经比较完善,为促进社会发展和维护社
中外学者对语言的得体性问题早有论述。Lecch将得体列为其礼貌原则下的条准则,中国学者对此有不同看法,其中以李瑞华的观点最为突出,李瑞华认为得体性应该是上升到礼貌原则之上
本论文研究了菊芋中多酚氧化酶(PPO)的酶学性质、新鲜菊芋的预处理、菊粉的微波技术辅助提取、菊粉的精制、超滤膜分离技术分级纯化菊粉、菊粉酶的壳聚糖柔性固定化、固定化菊
舰载飞机进舰着舰自动引导和控制系统是现代航空母舰/舰载飞机系统的关键技术,是航空母舰/舰载飞机相容性的重要研究内容。航空母舰自动着舰系统ACLS是舰载飞机自动进舰着舰技
三轴转台作为航海航天等领域中进行模拟、仿真、测试的关键设备,在科学试验过程中起到重要作用。它可以真实地复现被测器件在三个自由度方向的运动特征,从而对被测器件的性能进
当前,大力发展民办教育是当今时代对教育的必然要求。主要体现在:它是政治经济体制改革的需要;是落实国家政策、法规的具体举措;是顺应我国经济发展及扭转当前我国教育发展不充分