论文部分内容阅读
本文将基于有限混合模型的贝叶斯聚类方法推广应用到成分数据和有序数据的聚类分析。我们采用Dirichlet分布的有限混合模型建立了对成分数据聚类的算法。对有序数据,考虑到数据间的顺序信息,我们将有序变量视为由隐变量离散化生成的,在假定隐变量具有多元正态的混合模型的基础上建立了一套适用于有序数据的算法。我们采用EM算法推导出计算模型参数的后验最大值点的迭代算法,按BIC准则确定类数,最后用类似于贝叶斯判别的方法对数据进行聚类。模拟研究结果表明,本文聚类算法效果较好,对于中等规模的数据集,计算量是可以接受的。实例研究表明,采用本文的算法得到的聚类结果具有一定的参考意义。