基于距离的划分聚簇算法

来源 :第二届全国Web信息系统及其应用会议(WISA2005') | 被引量 : 0次 | 上传用户:serinol
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
k-means算法在聚簇大的数据集时是公认比较有效的算法之一,然而它只能应用在具有数值属性描述的数据对象集合上,这种数据对象叫做数值数据;却无法应用于真实世界中具有其他形形色色属性的数据对象集合上,比如颜色、纹理、形状等特征描述的数据对象集合,这种数据叫做分类数据.为了能对分类数据进行聚簇,对k-means算法进行了扩展,出现两种新的算法:一种是k-modes算法,另一种是k-protoypes算法.但这两种算法都需要用户事先确定聚簇数k阈值t和聚簇中心Q,在不明白数据分布状况的情况下能较准确地确定这3个参数值是很不容易的,改进的k-modes算法有效解决了这一问题.
其他文献
提出了一种混合推荐技术,它综合了基于内容的过滤和基于单值分解的协同过滤两种推荐算法,通过加权得到最后推荐结果并通过用户的反馈调整权重.两种推荐算法都有不足之处,混合
目前使用Web日志进行用户聚类的算法,大部分都没有考虑用户访问路径中页面的有序性.针对上述问题,本文在最长公共访问路径基础上,提出了一种用户访问路径相似度的计算方法,并
目的 评价胺碘酮预防冠状动脉旁路移植术术后心房颤动的有效性.方法 计算机检索中国生物医学文献数据库(CBM,1978年1月~2017年8月)、中国学术期刊全文数据库(CNKI,1987年1月~ 2
目的总结改良Fontan术治疗内脏异位综合征的效果和经验。方法回顾性分析2008年9月至2014年11月在我院完成改良Fontan术的17例内脏异位综合征患者的临床资料。其中男11例、女6
近几年来,Web应用研究已经成了知识工程和软件工程的热点问题.Web应用快速多变的特点导致了分析、理解和维护的困难.本文总结了近年来Web逆向工程的研究进展及主要研究方向,
数字化医学图像网格DMIGrid是利用网格技术将网格环境中的各类计算资源组织起来,隐藏内部异构性和动态性,充分实现网格互操作的特性,为用户提供安全、透明的图像共享、处理和
会议
移动agent是一个独立运行的计算机程序,它可以自主地在异构网络环境下,按照一定的规则移动,在网络上寻找合适的资源并利用这些资源来完成用户的任务.本文分析了移动agent间通
本文在通用搜索引擎的基础上,实现了一个专用于搜索网上Word文档的搜索引擎,通过实时解析Word文档的内容,可以自动发现内容较受用户关注的WebWord文档.
在分析远程监控原理的基础上,结合日志文件管理、创建、检索、荻取日志文件内容等的实现方法和WebServices方式的日志处理,利用FileWatcher组件,通过对日志文件的监控,在ASP.
再没有比赞比西河和它的大爆布更能够代表赞比亚的壮丽景色,也再没有比它汹涌奔流的波涛和雄伟的瀑布更能够象征赞比亚人民争取独立斗争的英勇豪迈气概。在赞比亚独立的前夕