一种高维混合属性数据聚类算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:tianxiaowei2030
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在许多应用中,很多数据集都具有数值型和分类型数据的混合特征,k-prototype是针对这类数据聚类的经典方法之一,该方法是一种基于k-means和k-mode的聚类方法。在研究了现有的混合属性数据聚类方法之后,引入了一种新算法用于混合型数据聚类,不仅改进了prototype的选取方法,而且提出了一种新的针对混合型数据的相似度度量方式,基于此又提出了一种不同于k-prototype的数据到prototype的分配方式,采用类似层次聚类中凝聚聚类的思想进行聚类,通过在四个真实的混合型数据集上测试发现:与传统
其他文献
通过对健康成年人16周健身干预(八段锦和第九套广播体操)后心理效应的比较,得出:无论男女受试者,八段锦和广播体操组都能改善其压抑状况,对女性受试者改善情况尤为明显;八段
开封作为中国的七朝古都,有着2700多年的建城史,同时也是首批中国历史文化名城。这种特殊的历史地位,使开封文化源远流长,底蕴深厚。而开封胡同则是反映古都文化的重要窗口,
扶贫是NGO最为关注的基本领域之一,有影响力的NGO几乎都参与了扶贫活动。NGO参与扶贫具有增加扶贫资金,创新,灵活调整,更接近穷人,准确瞄准扶贫对象和专业化优势。未来参与扶
新中国成立以来,我国政府信息公开法治化与公众行政参与制民主得到了长足的发展。当前政府信息公开与参与式行政存在着相互制约的现实困境,我们应立足两者之间平衡与互动的辩
<正> 现代西方美学大体上是指19世纪末20世纪初以后的欧美现代美学。20世纪是个充满重大变革的时代,人类的科学文化取得了前所未有的进展,人们的自然观、社会观、伦理观以及
桑树是蚕桑生产的基础,而桑树病虫害是制约桑蚕产业可持续发展的重要制约因素之一。最近几年,那务镇结合地区气候环境和地理优势,积极发展蚕桑产业,经济效益进一步提升。但是
<正>《局外人》,成书于二战之后,是作者阿尔贝·加缪的成名之作,也是存在主义的代表作。作者以第一人称的视角,即"我"——默尔索这个局外人,来叙事。他的一言一行,所作所为,
聚酯薄膜与紫外光(UV)固化光油之间的附着力极差,用胶带拉脱时完全脱落.为此,分别采用AF-201磺化聚酯、YF-40聚丙烯酸树脂、PR-32聚氨酯、EX-40F丙烯酸改性聚氨酯和PX-1010丙
单铸试样分梅花试样和单根试样两类。图1为目前普遍使用的一种熔模单铸梅花试样。 梅花试样的浇注系统补缩条件好,铸造缺陷集中于梅花心部,试样组织致密,性能稳定。这种试样
作为“八朝古都”的开封,拥有着得天独厚的文化旅游资源,其中又以北宋时期遗留的历史胜迹最为丰富。本文将探讨如何凭借这些历史文化遗迹资源优势,科学合理的开发开封的文化