分类、聚类算法的研究与实现

来源 :吉林大学 | 被引量 : 0次 | 上传用户:civili1844
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文对数据挖掘中的分类和聚类方面的技术进行了初步的探讨和研究,对部分算法进行了实现和改进.其中,分类采用的核心方法是二叉的决策树归纳,一个重要的设计原则是对较大的数据量实现快速有效地分类.聚类选择了CLTree方法,它基于修改的决策树归纳,能够对规模较大、高维较高的数值型数据实现快速聚类,并自动发现聚类所在的子空间.该文对CLTree方法进行了扩展,给出了处理枚举型属性的有效办法,使它能够很好地对具有混合类型的数据进行聚类.该文还研究了交易数据的聚类算法,实现了基于互连性的层次聚类方法VBACC,并对算法中较为耗时的两步进行了修改,在不牺牲质量的前提下,使算法的运行速度得到提高.该算法通过分析交易数据,能够在商品的级别上给出合理的顾客分段.
其他文献
数字半色调技术是一种应用范围十分广泛的色调量化技术,它能将色调丰富的数字图像通过有限少量的色调来表示。由于人类视觉系统对数字图像的感知存在特殊的低通滤波效应,经过半
该文首先对实时嵌入式操作系统μC/OS-Ⅱ进行了深入的剖析;接着对星载操作系统的需求进行了分析;最后以星载操作系统需求分析为基础,对μC/OS-Ⅱ操作系统任务调度模块、任务管
人群疏散仿真在公共安全领域中有着重要应用。与传统人群仿真相比,疏散仿真具有行人个体状态和认知能力各异、环境危险情况多变、疏散时间压力大等特点。本文主要针对拥挤人群
目前,汇率预测常用的方法有人工神经网络和贝叶斯估计方法,但它们一般都仅基于数据本身,没有充分利用与之相关的经验知识.事实上,影响汇率变动的因素很多,如政治、经济、心理
随着社会发展,电子商务正成为现代商务的主流,而政府作为社会主要信息的收集和发布者,如果其信息化应用水平跟不上企业和社会上信息发展的步伐,信息化应用水平跟不上企业和社会信
现在的软件系统对软件质量的要求越来越高.如何提高软件质量有两个关键因素:过程质量的控制和软件产品本身的质量.在传统的软件测试中,比如V模型,人们只对软件产品本身进行测
软件维护占据了软件产品的很大一部分成本,以往的研究显示软件维护消耗了70%左右的软件开发成本。随着现代软件工程的发展,软件缺陷(bugs)是不可避免的产物。修复软件缺陷是软件
90年代初期是客户/服务器模式的鼎盛时期,大多数金融、电信企业采用这种技术,组建企业内部网,这种架构分为客户机、服务器两个层次,其主要特点是:客户端:提供用户操作界面,接
随着电子商务的发展,电子商务系统所包含的商品信息越来越多,给电子商务系统的用户带来了所谓的“信息过载”问题,即用户需要过滤掉越来越多的无关内容才能找到自己感兴趣的商品
该文撰写的背景是中国科学院“十五”重大科研项目--科学数据库及其信息系统.该文的主要研究成果包括(1)综合的考察并分析了科学数据库对元数据标准的需求,为科学数据库中如何