ID3算法、朴素贝叶斯算法和BP神经网络算法的比较和分析研究

被引量 : 12次 | 上传用户:javaer0128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一门交叉学科,涉及数据库、统计学、人工智能和机器学习等多个领域,数据挖掘又称数据库中的知识发现,就是从大量数据中获取的有效的、潜在有用的并且最终可理解的模式的非平凡过程,显而易见数据挖掘就是从大量的数据里提取或者“挖掘”知识!分类是数据挖掘技术中一项非常重要的研究课题,利用分类可以从数据集中提取描述数据类相同的一个模型或者函数,并把数据集中的每个未知类别的对象归结到某个已知的对象类中,目前的分类算法主要是统计分类法、神经网络、决策树等。不同的分类算法会产生不同的分类器,分类器的好坏直接影响到数据挖掘的效率和准确性。因而,当对海量的大规模的数据进行分类时,选择最合适的分类算法是非常重要的。但是分类的效果一般和数据的特点有关,有的数据噪声大,有的有缺值,有的分布稀疏,有的字段或属性间相关性强,有的属性是离散的而有的是连续值或混合式的,没有一种方法能适合所有不同特点的数据。因此,本文针对分类算法中的经典的工D3算法、朴素贝叶斯算法、BP神经网络算法的研究现状进行总结的基础上,结合四大数据,用两种验证方式,分别对预测准确度,建立分类模型的时间,模型的简洁度进行比较分析,总结优点,看到缺陷,并提出展望。
其他文献
针对现代装备的高性能要求,本文提出利用冗余驱动并联机构来提升技术装备的整体驱动能力和提高机构的容错性能,并系统研究驱动冗余并联机构的构型综合理论。提出了一种系统综
底物降解动力模型是用于预测污染物的去除率和所需时间的重要手段。该文以前期构建的苯系物降解菌群M4为对象,采用Haldane模型研究苯系物的好氧降解规律,得到细胞生长最大比
进入二十一世纪以来,我国的经济发展进入了快车道,越来越多的家庭拥有汽车,它已经走入了寻常百姓家,使我国成为世界上拥有车辆最多的国家之一。交通管理工作任务的复杂性、艰
随着经济的快速发展,现代化物流配送面临着严峻的挑战。对企业而言,现代化物流配送能实现产品的零库存、降低物流成本,增强企业竞争能力。对用户来说,它简化了手续,方便了用
“人道主义干涉”在国际法领域一直是个热点问题。在实践中,由于缺乏法律上的标准,使人道主义干涉经常沦为霸权主义的工具或造成更大的人道主义灾难,带有强烈的大国主义色彩,
快速成型技术相对于传统的加工方法有着生产周期短、生产灵活性高、不受产品机构设计形状以及精度高等优点,而备受各制造业的青睐,是一项新型的、具有很大发展潜力的成型技术。
本论文分为八章第一章文献综述人参为五加科植物人参(Panax ginseng C. A. Mey.)的干燥根,具有大补元气、补脾益肺、生津止渴、安神益智的功效。人参是名贵中药材,野山参因系
近年来,随着呼和浩特市经济的迅速发展,物业管理作为城市管理的一种新形式和市场经济的新兴服务产业,呈现出良好的发展趋势,被越来越多的人所接受。国内知名的、实力雄厚的物
解放思想永葆马克思主义生机活力$$变革是大势所趋、人心所向,顺之则昌、逆之则亡。马克思主义是全党全国人民团结奋斗的共同思想基础。坚持解放思想、实事求是,始终是马克思主
报纸
土家族是一个历史悠久、勤劳善良、积极进取且具有拼搏精神的内地少数民族,主要分布于湘鄂渝黔交界地带。近年来研究者对土家族的研究越来越多,但主要集中于对其语言、习俗、文