BIRCH混合属性数据聚类方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:clast
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据聚类是数据挖掘中的重要研究内容。现实世界中的数据往往同时具有连续属性和离散属性,但现有大多数算法局限于仅处理其中一种属性,而对另一种采取简单舍弃的办法丢失聚类信息和降低聚类质量。一些能处理混合属性的算法又往往处理的属性过多,导致计算量的大增。提出了一种基于BIRCH算法的混合属性数据的聚类算法;在UCI数据集上的实验表明,文中提出的算法具有较好的性能。
其他文献
Excel对数据的自动处理和计算有着强大功能.在体育教学管理中运用Excel表格管理学生体育成绩可以取得显著成效.
协同训练可以提高半监督分类器的分类精度,而如何构建具有冗余特性的训练集是其关键所在。依据遥感影像的纹理特征,提出了基于纹理特征值及像素灰度值构建的两个训练集上协同训练支持向量机的算法CTSVMTRS。仿真实验比较了在不同训练集上CTSVMTRS的分类效果,在叠代训练过程中,两类数据集的所有过程的测试结果都存在的明显差异验证了提出的观念。
为自动检测驾驶员行车路线,通过车载CCD图像传感器获得序列图像,利用计算机视觉技术,建立摄像机的透视投影模型和汽车换道行驶检测模型,应用改进的Hough变换识别道路标线,确立直线方程,采用逆透视投影变换对车辆在当前位置的横向距离和横向偏转角做出估计,进而对汽车行驶状态做出判断。实验证明,该方法能够正确检测和判断驾驶员是否处于压线行驶和换道行驶状态。
戴庆厦,著名语言学家,中央民族大学教授、首席科学家、博士生导师,云南师范大学汉藏语研究院院长,国家民族事务委员会(部级)系统突出贡献专家,北京市教学名师,美国语言学会终身荣誉会
黔南民族师范学院的“中国古典文献学”2006年11月被批准为贵州省省级重点学科,贵州省省管专家梁光华二级教授担任领衔教授。
对卫星移动通信系统中用户上行链路的干扰问题进行了探讨,针对卫星移动通信系统的特殊性,讨论了卫星天线远场方向图及干扰模型,在具体分析功率控制和地面用户环境等因素的基础上
1蔬菜产地价、零售价均平稳,批发价小幅上涨1.1蔬菜产地价跌多涨少,总体平稳第48周(2019-11-25—2019-12-01)重庆市21个主要产地蔬菜监测品种均价2.89元(千克价,以下无特别说
介绍了内蒙古兴安盟索伦地区的区域地质背景,分析了该区的成矿条件.提出了该区成为多金属矿产地的可能性.
以生产环境下多机器人作业为背景 ,提出了一个虚拟制造中的多机器人作业仿真平台 ,讨论了平台的建模 (包括机器人本体及环境建模 )、碰撞检验、运动学分析、工作单元仿真、系
传统的模糊C-均值聚类算法未利用图像的空间信息,在分割迭加了噪声的MR图像时分割精度较差。采用了既能有效去除噪声又能较好地保持图像边缘特征的非局部降噪方法,结合基于图像灰度直方图聚类分析的快速模糊C-均值聚类算法,得到了一种具有较高分割精度的图像快速分割算法。通过对模拟图像、仿真脑部MR图像和临床脑部MR图像的分割实验,表明提出的新算法比已有的快速模糊C-均值聚类算法有更精确的图像分割能力。