基于Hubness现象的高维数据混合聚类算法

来源 :电视技术 | 被引量 : 0次 | 上传用户:zjxtlgj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高维数据聚类是聚类分析中的难点。K-hubs聚类算法是在K-means方法基础上,结合高维数据空间的Hubness现象对数据进行聚类。针对K-hubs聚类算法需要随机确定初始聚类中心,不适用于非超球状簇等问题,本文提出了基于多阶段层次聚类和划分聚类的高维数据混合聚类算法。该算法将数据点按其Hub值分为Hub点,Midhub点和Antihub点三类,然后对Hub点和Midhub点分别采用层次聚类,接着进一步采用层次聚类合并簇,最后,对Antihub点利用划分聚类合并到最近的簇。在UCI数据集上的实验结果表明
其他文献
为时一周的中考阅卷,使笔者有机会在零距离接触中考试题的同时,走近了我市三万考生的答卷.现在阅卷虽然结束了,但考生如万花筒般的答卷却历历在目.客观地讲,今年的陕西中考试
本文简介了 Vickels 公司 M41型 Z 轴检测显微镜的工作原理和测量方法,并测量了实验片。测量结果表明:此测量方法能够把条深控制在10%的公差范围内。
采用文献资料、专家访谈、问卷调查等方法,对长江三角洲地区部分中学的学生对阳光体育运动的了解途径、学生的参与阳光体育运动的情况、学生参与阳光体育运动的时间、对学生课
以内蒙古黄旗海属内陆断陷型湖盆中面积最大且朵叶期次明显的大河湾三角洲为研究对象,通过野外采集的109个样品粒度特征分析,结合近200 a来该地区的水文资料,提取并对比环境
通过问卷调查等方法对我国大学生体育竞赛中违法违纪行为进行分析.主要结论:我国大学生体育竞赛的违法违纪行为主要体现在参赛资格上弄虚作假、违规服用兴奋剂、裁判执法不严与
一、识读同步,引发兴趣新入学的一年级小学生往往对课本爱不释手,他们津津有味地翻看一页页精美的图文。那一双双明亮的眼睛分明告诉我们:他们多么希望自己会认、会读啊!因此教
从运动员和教练员两方面入手,对我国女子沙滩排球运动队的人员素质现状进行分析,结果表明:我国女子沙滩排球队运动员身体条件较好,学历结构合理,但年龄偏小,训练年限短;教练员
赣南是我国江西省南部区域,拥有深厚的文化底蕴,因为地理位置的原因很多其他区域的文化都在这里汇合,由此赣南文化呈现多元化的特征.赣南采茶舞是赣南文化最具特色的一种.虽
为了提高扬声器等音频设备的设计效率和工作性能,通过多物理场分析软件对扬声器模型进行建模分析,并且基于扬声器的工作原理提出了一种对三维复杂模型进行单项解耦的分析方法
为全面落实由教育部、国家体育总局、共青团中央倡导的叩日光体育运动”在高校的开展与实施,促进大学生的体质健康,加强高等院校“阳光体育运动”考评和管理,通过实践研究开发了