基于簇内与簇间信息的混合数据聚类算法研究与应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:ekinhushuang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
簇中心表示、属性权重量化、簇数确定和分析工具缺少是当前混合数据聚类研究中的主要研究热点问题。本文综合应用了簇内标称属性滤噪策略、簇内与簇间信息自适应权重调整策略和基于分类效用函数的混合数据划分度量合理性策略。研究提出了带滤噪分布质心与权重调整的混合数据聚类算法(MCFCAW(1))和基于分类效用函数的混合数据簇数确定算法(DNCCUFM(2)),并设计实现了基于PyQt5的混合数据聚类分析工具(MDCA-Tool(3))。主要研究内容和成果如下:1.为准确表示混合数据簇中心标称属性部分以及自动量化标称属性和数值属性权重,提出了MCFCAW算法。簇内标称属性滤噪策略能够准确地刻画簇内标称属性的取值分布,达到滤除簇内标称属性“噪声取值”的目标;簇内与簇间信息自适应权重调整策略以簇间异质性和簇内同质性为判断依据,赋予重要属性相对更大权重。实例分析与实验结果共同表明MCFCAW算法有效可行,收敛速度更快,混合数据聚类效果更好。2.为解决混合数据簇数确定的问题,提出了DNCCUFM算法。基于信息熵和离散系数的分类效用函数能够量化簇内属性和数据集属性的离散程度,达到量化混合数据聚类结果划分合理性的目的。DNCCUFM算法能够凭借在数据集上混合数据聚类算法不同簇数设定下的聚类结果确定数据集的近似最优簇数。实例分析与实验结果共同表明DNCCUFM算法有效可行,其簇数确定在数值数据集上准确性更高、在标称数据集和混合数据集上效率更高。3.开发了MDCA-Tool工具,实现了参数设置、数据管理、算法运行、实验记录等功能模块,将算法涉及的操作进行合理划分,并有效的管理输入输出数据。本文研究贡献:提出滤噪分布质心解决簇中心标称属性部分表示不准确的问题;基于簇内与簇间信息提出自适应权重调整策略迭代统一量化标称属性和数值属性的权重;借助离散系数和信息熵提出混合数据分类效用函数量化混合数据聚类结果合理性;开发基于PyQt5的混合数据聚类分析工具。
其他文献
没骨法和破墨法作为一种传统技法,更多的运用在在花鸟画中,随着绘画的多样性和创作性手段日益丰富,技法的边界性也变得模糊起来;时代的发展和文化美学的交流融合更是让中国水墨画不断的展现出新的形势与面貌。本文将没骨和破墨作为一种技法和传统笔墨精神的象征,从没骨和破墨的发展和演变、技法的借鉴和解读,到技法的延伸和丰富以及在创作中的运用这几个方面;将传统笔墨的传承和时代历程变化作为创作前提,用没骨人物画的表现
随着城镇化建设快速推进,越来越多的城市高层建筑采用玻璃幕墙来作为装饰,但玻璃幕墙后期的清洁检测维护却是一大难题。目前市场上,仍旧是采用传统人工方式,危险系数大,且清洗设备成本高昂。如果没有专业、便捷的检测设备,将大大制约玻璃幕墙的实用化进程。基于对解决社会问题和产生具有社会价值产品的思考,探索并建立了“D+X”模块化设计方法。致力探讨技术与创新的关系,将模块化的理论探讨引入产业实践,通过数字化平台
近些年来,互联网的发展已经渗透到了每一个领域,伴随着计算机技术与网络的迅猛发展,网络安全问题也面临着严峻的考验,各种形式的网络入侵行为层出不穷。如何快速高效的检测网络异常入侵行为已成为网络安全领域的一个重要议题。当前已有的网络入侵检测相关技术研究,其存在研究数据样本不平衡,低占比样本预测召回率低,技术操作复杂难以推广等问题。基于此,本文将采用基于Easy Ensemble下采样与Table Gan
准确识别潜在违约贷款,提前阻止贷款发放或对已发放贷款进行跟踪处理以保证贷款收益,是金融风控领域的核心问题。针对当前贷款违约预测模型分类性能低、缺乏稳定性且泛化能力不足等问题,本文利用金融贷款数据集构建了基于GSCV-XGBoost的贷款违约预测模型,提出了基于XGBoost-Stacking集成学习的贷款违约预测模型,基于Django框架开发了贷款违约预测系统。主要研究工作和成果包括:1.构建了基
近年来,云计算的研究热度只增不减,关于云计算的研究已蔚然成风。其覆盖面十分广泛,生活中的各个场景如网上购物、导航,都能发现其身影。且不论是金融领域、医疗领域、通信领域甚至是政府工作领域,云计算都得到了广泛应用,为我们的生产和生活都带来了极大的便利。云存储作为其延伸概念,也备受关注。特别是关于云存储的安全问题,即如何保障数据所有者存储在云服务器上的数据的机密性,保护信息不被篡改、删除、伪造,维护用户
随着我国经济的迅速发展和人们生活水平的提高,我国的老年人数量呈直线增长的趋势,养老问题成为日益凸出的问题。面对普遍存在着的养老难这个问题,我国政府提出了一种新型模式——社区居家养老服务模式。此模式是参照国外的一些理论和成功案例,在此基础上结合我国的国情展开的一种新型模式,这种模式可以让老年人不脱离原来的生活和居住环境,在熟悉的社区里就能享受到方便舒适的各项养老服务,完善社区居家养老服务中心是政府的
视频是承载着动态信息的多媒体载体,蕴含了丰富的语义信息,而高层的语义信息与常规认知中的低层特征之间常常存在“语义鸿沟”。为缩小视频的“语义鸿沟”,本文以教学视频为研究对象,综合视频的图像模态及文本模态从视频结构化、视频信息提取等方面对视频检索技术展开研究,并基于视频的多模态信息设计实现了视频检索系统,以提高用户对于教学视频的检索效率。主要研究工作和成果包括:1.提出了一种基于时空切片与相似度度量(
混沌映射因其本身所具有的复杂动力学特性,如对初始条件的高度敏感性、随机性、非周期性、长期不可预测性、高复杂度等,被广泛应用于许多不同的科学领域中。但在实际运用中,在计算机等有限精度设备上实现的混沌映射受限于精度会出现动力学退化现象。此时的混沌映射不再被认为是严格数学定义下的混沌,其各项动力学特性都已经退化,不再适用于密码设计。此类映射一般被称为数字混沌映射。为此,本文提出两种改进数字混沌映射动力学
本系列工作主要探讨光响应无机纳米颗粒(黑磷),以及有机高分子聚合物(聚氨酯)制备生物复合材料及其在抗抑郁和调节肠道菌群领域的应用。本论文的主要工作内容如下:第一章:介绍光响应生物医用材料黑磷、聚氨酯和金纳米颗粒的研究背景、物理化学性质以及在生物医学领域的应用。最后,提出了本论文的选题依据。第二章:我们证明了负载氟西汀(Flu)的BP纳米片对抑郁症的治疗作用。体外和体内研究表明,与游离Flu相比,黑
复合材料是多学科交叉、相互渗透的产物,因其具有设计自由度大的特点,成为当前研究的热点和重点之一,已被广泛应用于航空航天、汽车工业、化工制造以及生物医学领域。本文就抗菌和感染创面的治疗问题分别提出相应的解决策略,设计并开发了两种以氧化锌(zinc oxide,Zn O)为代表的光响应性复合材料,并系统地探索了材料的理化性质和生物相容性,最后研究了它们的抗菌作用和促进伤口愈合的性能。主要研究内容包括以