【摘 要】
:
有限混合模型进行高维数据聚类分析时需预先估计聚类个数,因而聚类的准确性和泛化性受到影响.通过建立Dirichlet过程无限混合模型对高维数据开展聚类分析,采用Dirichlet过程
【基金项目】
:
中央高校基本科研业务费专项资金项目(2010QNA50,2010QNA47);霍英东基金会青年教师基金项目(121066)
论文部分内容阅读
有限混合模型进行高维数据聚类分析时需预先估计聚类个数,因而聚类的准确性和泛化性受到影响.通过建立Dirichlet过程无限混合模型对高维数据开展聚类分析,采用Dirichlet过程的Urn模型分析出模型中各参数的后验分布,利用Gibbs采样MCMC方法估计出模型中各参数及数据中潜在的聚类数.在五维的仿真数据集和IRIS测试数据集上的聚类结果表明:经过200次Gibbs采样MCMC过程,该算法能够正确地估计出数据中潜在的聚类数.单次Gibbs采样MCMC过程的平均占用时间分别为0.185 0s和0.145 5s,其时间复杂度和数据的样本个数N有关,为O(N).
其他文献
目的:评价下肢深静脉造影的临床应用价值.方法:自1981年10月~1998年12月共检查7555例,7908条下肢.所有患肢均作顺行造影检查,部分患肢还作其它造影或无创检查.结果:患病率最高
艺术院校大学生文学教育工作是我国高等教育工作的重要组成部分,是培养大学生人文素质的重要途径,也是艺术人才教育过程中的薄弱环节。分析文学教育工作在艺术院校中遇到的困
吴天明清醒地知道传统思想和现代文化的矛盾,在表达人物在这种矛盾中苦痛挣扎的时候,其作品具有鲜明的时代感和悲情艺术。而当吴天明终究难以逃脱影响他已久的传统文化之时,他往
以某地区2012~2015年电站锅炉定期检验检出缺陷为样本,统计该地区当前阶段自备电厂电站 锅炉定期检验发现的缺陷;提炼有普遍性、广泛性的典型缺陷,分析原因,提出避免措施,汇总
赞皇大枣在陕北黄土丘陵区的表现王延平,刘生禹(陕西省黄土高原治理研究所米脂718100)赞皇大枣主产于河北赞皇一带太行山区,是著名的干鲜兼优枣品种之一。为选取适合于当地自然条件的优
马克思的劳动解放思想其核心内容可以概括为两个方面:劳动解放人和解放人的劳动。在资本主义社会,资本主义生产方式对劳动解放实现既有积极促进的一面又有消极阻碍的一面。只有
在我国的企业信息化管理发展变化过程中,传统的管理方式都是进行人为管理,这种管理方式效率低下,弊端也有很多,随着科学和技术的发展,运用信息技术来进行管理已经成为势不可
创新高职学生党员思想教育模式是当前高职院校学生党员思想政治教育需迫切解决的重问题。转变高职学生党员思想教育理念、创新党员思想教育方式方法和载体、完善学生党员思想
本文从国有企业现有的选拔机制和激励机制出发,探讨了国企经营者在利润报告上的行为选择问题。博弈分析发现选拔机制将导致激励机制难以发挥作用,即使将经营者收入与报告利润挂