分类数据挖掘中若干基本问题的研究

被引量 : 0次 | 上传用户:bengouwa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对大规模的、高维的数据,如何建立有效的,可扩展的分类数据挖掘算法是数据挖掘领域的研究热点。围绕以上问题,本文对分类数据挖掘中涉及的若干基本问题进行了深入研究,主要包括以下几个方面的内容:提出了一种结构自适应的神经网络特征选择方法。通过交替删除网络中冗余的输入特征和隐结点,使网络结构在特征选择的过程中保持相对良好。实验表明该方法能快速有效删除特征,提高网络泛化性能。提出一种基于粗集理论和神经网络相结合的分类规则挖掘算法。首先使用粗集理论和神经网络对决策表进行两次属性约简,然后使用粗集理论对约简后的决策表进行规则抽取。该方法充分融合了粗集理论强大的规则生成能力和神经网络优良的容错性能。实验表明,该方法快速有效,生成规则简单准确,具有良好的鲁棒性。属性离散化的方法可以分为两类:局部方法和全局方法。局部方法简单易行但效果较差,而全局方法效果较好但算法复杂计算量大。本文提出一种有效的结合两类方法优点的折衷算法,在一种已有基于熵的局部算法基础上加入对决策表数据不一致度的检验,从而使该算法具有了全局化的特性。实验结果表明使用相同的规则生成器C4.5,本文方法比传统离散化方法生成的规则更强壮。对目前广泛应用的基于粗集理论和信息熵的几种规则不确定性度量准则进行了比较分析,通过定理证明了它们之间存在不一致性以及发生不一致时的必要条件,提出了下一步构建更有效的不确定性度量的方向。提出一种基于粗糙集理论的分类别进行规则抽取的算法。首先获得每类数据的属性约简;然后为每类数据构造一个分辨矩阵和一个合并矩阵,通过两个矩阵的交互作用逐类抽取规则。UCI数据库上的实验结果表明,与传统方法相比该算法能够在更短的时间内得到分类精度更高的规则。
其他文献
从情报研究对象、理论起点、理论主线与内容三个方面简单归纳和评价美国著名情报学家萨拉塞维奇的情报社会传播理论的观点,认为其社会传播理论是情报学界较为完整的,具有较高
以合作学习理论为指导,探讨将合作学习理论运用到初中英语教学中的有效策略,切实提高学生的英语学习兴趣,提高他们的综合素质,进而为初中英语教学从应试教育向素质教育改革提
环境污染是全球问题,造成环境污染的原因虽然很多,但是这些原因在哲学层面都可以归结为人的行为。从实践角度对于人的行为如何造成环境污染以及如何解决环境污染问题进行分析
行政改革作为政治改革与经济改革的“结合部”,在中国发展的不同阶段一直都成为关注热点。任何的改革都应有其价值上的追求。中国行政改革的价值取向决定了其改革最终目标,同时
1979年以来我国刑事立法和司法忽视或遗忘了刑法的特征与内在价值,高估了刑法影响人的行为的可能性,刑法一直保持着在功能化方向上的惯性,刑罚结构和刑罚适用面临着重刑主义
通过回顾历史对学生进行科学方法教育与思维能力培养,理解牛顿第一定律;加深对惯性概念的理解。正确认识物体"运动跟力"的关系"惯性与质量"的关系。激发学生追求科学,勇于创
目的:观察牛痘疫苗致炎兔皮提取物(analgecine)对于三叉神经痛的效果及镇痛机制。方法:将大鼠制成单侧缩窄性三叉神经痛模型,在痛觉超敏期随机分为两组。牛痘疫苗致炎兔皮提
利用2002年全国各省市数据和广东省1988—2003年数据,运用相关分析、回归分析等统计分析方法,从纵向和横向上分析了科技投入和知识产权保护与社会经济发展、进出口及吸引外商
北周是麦积山石窟营建史上一个重要时期,开凿的洞窟数量众多、规模宏大。以麦积山为代表的秦陇地区北周佛教造像在充分吸纳经成都传入的受印度笈多造像样式的同时,又在"恢复
中国山水画作为独立的绘画形式,深受魏晋时期以老、庄思想为核心的玄学影响,以时人宗炳的《画山水序》和王微的《叙画》两篇山水画理论文献最为重要,他们提出了画山水就要写