学习特征权值对K-均值聚类算法的优化

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:hdjc1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
K 均值 (K means)算法聚类的结果依赖于距离度量的选取 传统的K 均值算法选择的相似性度量通常是欧几里德距离的倒数 ,这种距离通常涉及所有的特征 在距离公式中引入一些特征权参数后 ,其聚类结果将依赖于这些权值 ,从而可以通过调整这些权值优化聚类效果 由于K 均值算法是迭代算法 ,很难直接确定其权值以优化聚类结果 ,因此提出了一种间接的学习权值算法以改进聚类结果 从数学意义上讲 ,这种权值学习相当于欧氏空间中对一组点进行了一个线性变换 数值实验证实了算法的有效性
其他文献
在习近平新时代中国特色社会主义思想的指导下,在党的十九大报告的引领下,恰逢改革开放40周年,在"千年大计,国家大事"的雄安新区,选择对当地农业进行调研。了解雄安原来农业
供应链金融并非是新鲜事务,但在今天它被赋予了新的含义。由于当前国内主流金融服务存在结构缺陷,不能完全匹配中小企业的融资需求,应收账款、融资租赁等金融业态的快速发展以及在国家政策的大力支持下,我国供应链金融行业已经进入高速发展的阶段。建筑企业通常存在较大的资金需求,其生产、销售及回款模式周期较长,资金的使用效率较低、现金周转压力大、负债比例高是普遍的行业特点,造成建筑行业中的各建筑企业可能会面临严重
目的研究脐血S100B蛋白在早产儿脑损伤中的临床意义及预测价值。方法对59例孕周<34周的早产儿用酶联免疫吸附试验检测脐血S100B蛋白;将母亲的胎盘胎膜组织行病理学检查,诊断
<正>在平版胶印印刷中,影响油墨密度的因素很多。比如油墨的首层表面反射、油墨的多重内反射、油墨的透明性不良、油墨的选择性吸收不纯等都直接影响到印刷油墨的实地密度。
通过对聚乳酸(PLA)纤维染色温度、染色色光、分散染料升温速率曲线、移染性和提升性的试验研究,讨论了分散染料结构特性与PLA纤维染色性能的关系。研究结果表明:分散染料结构
目前大学生就业问题日益严峻。文章通过对比中日韩三国大学生就业问题的特点,总结出其相同之处与不同之处,并在此基础上提出了解决我国大学生就业问题的相关建议。
<正>中国共产党一直重视意识形态工作,提出过枪杆子和笔杆子这"两杆子"以及物质文明和精神文明"两手抓"等重要论断。习近平总书记在全国宣传思想工作会议上指出意识形态工作
目的:了解医疗机构性病服务的现状,为进一步提供更好的性病诊疗服务。方法:2015年对全国各级医疗机构进行抽样问卷调查,应用SAS 9.2软件对调查资料进行统计分析。结果:共调查
目的调查精神分裂症患者的童年创伤事件,并分析男女患者间的差异,以寻找更好预防精神分裂症的方法。方法对125例精神分裂症患者(精神分裂症组)和99例健康者(健康对照组)采用
<正>近年来,青海省湟中县畜牧业生产不断创新发展模式,把推进规模养殖作为转变畜牧业发展方式的着力点,稳步推进养殖园区和规模养殖基地建设,促进了畜牧业向园区化、规模化、
期刊