数据挖掘中的分类技术及其知识提取

来源 :南开大学 | 被引量 : 0次 | 上传用户:lxj5186101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文分别对神经网络和决策树这两种分类技术进行了探讨.对于神经网络,该文先介绍神经网络的基本知识,然后讨论采用神经网络进行特征提取以对高维数据进行降维,并介绍将神经网络用于网球运动员体能分析的具体应用.随后作为该文的主要内容,重点讨论神经网络的知识提取.以往认为神经网络的价值主要在于通过对样本的学习,能够对未知样本进行分类工作.但实际上神经网络本身还蕴含了丰富而宝贵的知识,只不过因为这些知识以连接和权重的形式存在,不易于理解,因而不能为人所用.该文介绍了两种典型的神经网络知识提取方法,用于从神经网络中提取出易于理解的规则,并采用经典的数据集对其中的一种方法进行验证,随后将这种方法应用于实际的银行信用卡资信评估,并得到了有意义的结论和建议.对于决策树,该文介绍了其基本思想和经典的ID3算法,随后作为该文的另一工作,介绍决策树的知识表达和提取,重点论述由作者提出的在决策树应用阶段引入决策树来表达挖掘结果,使其能够更好的体现挖掘结果的思想并给出了其具体应用实例.
其他文献
“基于P2P计算模型的局域网分布存储系统”是信息产业部“电子发展基金”支持的“网络专用服务器”项目下面的一个子课题。 随着个人PC机性能的增强,Peer-to-peer模型得到
在现有的因特网上进行实时的连续媒体传输是具有挑战性的。根本的原因在于IP网络只提供尽力而为的服务,不提供任何服务质量(QoS)保证,不适合连续媒体流的传输。 为保证连续
基于移动传感网络的城市感知,为智慧城市提供了细粒度和多种类的数据信息。随着传感器技术的发展,各类低成本,便携式的传感器开始投入到移动传感网络当中。然而,由于受到时间偏移
该文吸收和借鉴了当前流行的各种嵌入式操作系统的设计和解决方案,认真、深入的研究了包括μC/OS-Ⅱ和VRTX在内的嵌入式操作系统的组成及结构.在此基础上,提出了基于第二代智
该模型由策略代理、策略服务器以及策略数据库构成.其中,策略代理与VPN网络设备关联,执行策略服务器规定的策略进行隧道通信;策略数据库存储着相应管理域内的策略; 策略服务
无人驾驶车辆是目前学术界和工业界研究的热点方向,无人驾驶系统通常包括环境感知、数据融合、路径规划、控制系统等几大模块,其中,环境感知模块为无人驾驶系统提供了对周围环境
J2EE是Sun公司提出和制定的基于Java技术的分布式组件计算平台规范,基于这个平台可以实现快速开发和部署多层结构的易于移植的应用系统。JBoss是一个开放源码的J2EE应用服务器
该文主要是针对在具体应用中如何高效地、正确地进行关联规则挖掘这一问题作了一些探讨.在对具体情况进行了研究之后,针对一些关键性的问题进行改进:在挖掘策略方面引入了阶
学位
该文的主题是,根据净室软件工程的理论,提出一套切实可行的方案,帮助软件开发团队以较高的效费比开发高质量的软件,从根本上解决软件高失效问题.方案并非对净室软件工程基本