一种基于GA的混合属性特征大数据集聚类算法

来源 :电子与信息学报 | 被引量 : 0次 | 上传用户:lqym2929
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘中,经常会遇到和分析大量具有数值和类属特征的数据.然而,现有的大多数算法只能单独处理数值特征数据或类属特征数据,而不能分析具有混合属性的数据.为此,该文提出了一种基于GA的模糊聚类新算法,通过改进聚类目标函数将数值特征与类属特征相结合,从而实现具有混合属性特征数据的聚类分析;通过引入GA算法能够快速得到全局最优解,而且不依赖于原型初始化.实验结果表明,基于GA的新聚类算法对于处理具有混合特征的大数据集聚类问题是相当有效的.
其他文献
以2003—2014年我国上市公司财务报告附注中披露的或有事项信息为研究对象,考察或有事项信息披露对企业价值的影响。研究发现:或有事项信息披露可以提升企业价值;或有事项信
本文以广东本地漂浮植物凤眼莲[Eichhorniacrassipes(Mart.)Solms]、水浮莲[Pistiastratiotes(Raf.)Merr.]和水龙[Ludwigiaadscendens(L.)Hara]为供试植物,以此及其相互组合
从勘察方案的确定、可行性研究勘察、初步勘察、详细勘察、施工勘察五方面,探讨了岩土工程勘察与岩土工程设计的关系,指出岩土工程勘察与岩土工程设计相辅相成、不可分割,两
传播是人类借助符号交流信息的活动。对视觉传播符号—文字和图形形成充分的认识并能恰当地应用,将有助于设计者设计出更为优秀的视觉传达作品,引起更多消费者对产品的关注,
目的:研究浅刺针法对脑缺血大鼠细胞凋亡调控基因Bcl-2(B cell lymphoma/leukemia-2)、Bax(Bcl-2Associated X protein)的影响。方法:将240只Wistar大鼠随机分造模组和空白组
目的:探讨人参皂苷Rg3对人肺鳞癌SK-MES-1细胞裸鼠移植瘤的生长及血管生成相关因子VEGF、bF-GF表达的影响。方法:通过皮下种植SK-MES-1细胞建立人肺鳞癌裸鼠移植瘤模型,成瘤
目的:研究分期针刺治疗贝尔面瘫的临床疗效,为针灸临床提供依据。方法:将114例贝尔面瘫患者随机分为治疗组(分期针刺组)和对照组(不分期针刺组)。治疗组根据该病不同病理变化
为探讨汞化合物对脏器及生殖的毒性,采用卵母细胞体外培养、体外受精的方法研究了汞对小鼠脏器系数、卵母细胞成熟和受精能力的影响。结果表明,0.5和1.5mg/kgBW汞对小鼠的肝
山东自然资源丰富,历史源远流长,文化底蕴深厚,改革开放30多年来,尤其是"十一五"期间,旅游业发展取得了长足进步。在激烈的旅游竞争中,山东省更应该把握机遇,加快发展步伐,全
松动荷载引起损伤衬砌失稳是不良地层隧道运营期间关键的科学问题。针对此问题,研制了双车道公路隧道带缝衬砌套拱加固模型试验加载装置,可对衬砌结构任意位置施加松动荷载,