基于平行坐标的可视化交互分类

被引量 : 0次 | 上传用户:wcf2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘的不断发展,可视化数据挖掘逐步兴起。借助可视化技术,可以在数据挖掘过程中更清晰地观察数据的分布结构、了解数据之间的关系、理解数据挖掘的过程和结果甚至直接参与数据挖掘过程。分类是数据挖掘中的一项重要任务,根据已知类别的数据集(训练集)建立一个分类模型,然后将未知类别的数据进行分类。其中决策树方法以其直观性和易用性深受欢迎,但建树过程中人几乎不能参与交互。受决策树的启发,本文提出了一种极其直观简洁的分类算法——扫描分支决策树算法(Scanned-Branch Tree, SBTree),不对数据集进行分裂,而是对数据集中的每一维进行扫描,直接从属性中提取决策分支,最终的分类模型是一棵单枝多叶状的决策树,其实质是一个有次序的规则序列集。在实验证明了SBTree有效性的基础上,将其与平行坐标相结合,用于可视化交互分类,用户可以在平行坐标的属性轴上可视化地寻找并提取SBTree决策分支,以全程交互的方式建立分类模型。这个过程不但使用户加深了对训练集的理解,而且增加了用户对分类模型的信任,交互过程中,人的领域知识和主观能动性也得到了极大的发挥。作为一种新的可视化交互分类方法,本文用实例说明了基于平行坐标的可视化交互分类的有效性和可行性,并讨论了这种交互分类在处理各种类型数据集时可以采用的途径,尝试使这种可视化交互分类方法成为一个体系,在这个体系下,凡是可以由传统决策树处理的问题,都可以使用SBTree可视化交互地处理。
其他文献
<正>建国以来,我国教育界涌现了一大批优秀人物,其中不少成了教育家。但是像吕型伟同志这样称得上著名教育家的还是凤毛麟角。寻找吕老出类拔萃的原因,对于广大优秀教育工作
作为数据挖掘的一种新方法,支持向量机从统计学习理论发展而来,是基于结构风险最小化原则设计的机器学习算法,很好地解决了传统机器学习算法所遇到的非线性、高维数、局部极
学生提问体现了学生的问题意识和思维能力,而培养人的思维能力是教育的使命之一。倡导课堂提问的学生主体转向将促进知识观由客观法定知识转型为客观知识与个体主观知识并存;
城市交通拥堵的持续加剧,城市居民的“出行难、坐车难、停车难”等问题进一步显现,给城市的健康可持续发展带来了严峻的挑战。为解决城市交通供需不平衡的矛盾,提升城市居民
要在幼儿园里有组织、有计划地开展各类科技活动,必须为幼儿创设丰富宽松的探索环境,为幼儿的科学活动配置充足的物质条件,随时满足幼儿求知欲的需要。游戏既是科学活动的内
目的分析急性有机磷农药中毒患者死亡原因,探索有效的救治方案。方法对25例死亡病例临床表现、治疗方案、并发症及各种死亡原因进行回顾性分析,探讨导致患者死亡的主要原因。
网络广告自诞生之日起便显示出其较之于传统媒体广告更广阔的发展前景,更丰富的表达形式以及更直接,更有针对性的信息传播内容。网络广告与传统媒体广告的最大区别在于,传统
日前,我国教育界名流齐聚上海中国浦东干部学院,共同畅谈、研讨具有中国基础教育"活化石"称号的吕型伟教育思想。已有90高龄的吕型伟先生,17岁开始教育生涯,做过教师,当过校
水溶性高分子外加剂少量掺加可显著改善新拌混凝土施工性,成倍提高硬化混凝土的强度、耐久性,延长建筑物的使用寿命等,成为该领域研究热点。本文在广东省科技攻关项目“新一
目的研究分析中年女性冠心病患者危险因素的危险程度。方法以冠心病或可疑冠心病收住院的中年女性468例,根据冠状动脉造影结果分为对照组(A组)和冠心病组(B组),危险因素分析