大样本数据聚类的改进方法

来源 :统计与决策 | 被引量 : 0次 | 上传用户:wcd_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
K-means算法是处理大样本数据的聚类分析的常用算法之一。该算法的不足之处是聚类的数目k必须事先给定。文章提出应用黄金分割法来度量有关该聚类的有效性.该方法能自动优化确定最佳的聚类个数,以此实现大样本数据的有效聚类;并采用实际数据说明了方法的合理性和有效性。
其他文献
文章针对现有的大部分单一分类器预测精度不高,且具有一定限制条件的弱点,提出了应用组合分类模型对中小企业信贷违约预判的方法。以调整的SVM后验概率分类器和多维正态分布
针对边值修正灰色GM(1,1)模型的边值修正项求解采用最小二乘准则,而模型检验采用最小一乘准则,提出基于最小一乘准则的边值修正项求解,从而在一定程度上统一了边值修正项求解和模型