基于若干改进策略的密度聚类方法及应用研究

来源 :吉林财经大学 | 被引量 : 0次 | 上传用户:hongxing35
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代的来临,使大数据分析成为金融等行业竞争发展的变革点,金融数据挖掘作为金融数据分析与处理的重要技术,目前已经成为国内外研究的热点。聚类是数据挖掘的关键技术之一,是本论文聚焦数据挖掘研究的重要手段。本文以密度峰值聚类算法(Clustering By Fast Search And Find Density Peak,DPC)和基于密度的空间聚类算法(Density-Based Spatial Clustering,DBSCAN)的深入研究为主要研究方向。针对基于密度的聚类算法进行了若干理论改进和应用研究,具体内容包括:(1)针对密度峰值聚类算法,局部密度计算方法不能很好地反映局部密度样本间相似度差异,不易处理复杂数据集的问题,提出了基于相似性度量方法的密度峰值聚类(Density Peak Clustering Algorithm Based on Similarity Method,GOA-DPC)算法。鉴于蚱蜢优化算法具有较优的全局搜索能力,将其引入到密度峰值聚类算法中。通过仿真模拟实验结果表明,本文提出的改进算法能够有效处理结构复杂的球形数据,在处理高维特征的数据时具有快速、有效处理噪声点和聚类精度高等优点。(2)针对改进halo点识别方法的密度峰值聚类算法识别出的halo点无法得到有效地分配的问题,提出了一种基于K最近邻理论的密度峰值halo点分配(Assignment Method on Halo for Density Peak Clustering Based on KNN Theory,KNN-HDPC)算法。仿真模拟实验结果表明,本文提出的算法在处理复杂数据时具有能够清晰地观测出halo点和类别点之间潜在关系和聚类效果好等优点。(3)针对提出的KNN-HDPC算法需要经过多次手动输入截断距离参数寻找最优聚类结果的问题,鉴于布谷鸟算法具有优秀的全局搜索能力,提出了基于布谷鸟优化的KNN-Halo点密度峰值聚类(K-Nearest Neighbor Halo Node Assignment Method for Density Peak Clustering Algorithm Based on Cuckoo Search Algorithm,CS-KHDPC)算法。通过仿真模拟实验结果表明,本文提出的算法具有能够快速找到最优的截断距离和最佳聚类结果等优点。(4)针对基于密度的空间聚类算法聚类半径Eps需要手动设置且很难得到有效聚类结果的问题,鉴于郊狼优化算法具有优秀的全局寻优策略,提出了基于郊狼优化的密度空间聚类(Density Spatial Clustering Based on Coyote Optimization Algorithm,COA-DBSCAN)算法。通过仿真模拟实验结果表明,本文提出的算法具有可以自适应地找到最佳的聚类半径和最优聚类效果等优点。
其他文献
东营市为黄河三角洲区域的中心城市,其生产总值近几年一直保持在3000亿元以上,展现出了较强的经济活力。但受滨海自然条件限制,系统性和规模性的城市建设相对起步较晚,随着国
大数据时代迅猛来袭,个性化推荐技术成为各个手机移动应用程序APP进行信息推荐的必需品,旨在于精准地为用户提供精准让他们感兴趣的信息。个性化推荐广告的广泛使用,一方面给消费者带来了便利,减轻了信息负担;但另一方面,这种投其所好的广告推送机制却隐藏着伦理失范的风险。为此,本文结合个性化推荐技术在广告领域的运用,建立起对消费者对个性化推荐广告的消费者伦理感知的研究。本文首先对国内外关于个性化推荐广告及伦
随着我国城市化进程加快,人民生活水平的提高,城市面貌有了很大的改善,但同时也带来了一系列严重威胁人类生存和生活的问题,如:资源破坏、能源消耗增加、污染加剧……公共服务质量低下、交通拥堵等,这些问题不仅制约了我国城市人居环境的建设,同时也加重了我国人居环境建设的负担。进入21世纪,提高人居环境建设的质量已经成为全球关注的一个焦点,而建设和谐、自然、健康、安全的人居环境将是人类永恒的发展主题。2015
全景技术近年来在军事,医学,民用等领域获得日益广泛的应用,相比于其他全景系统,全景环带光学系统使用单独镜头成像,体积小,实用性强。加工工艺与普通折射光学系统类似,设计
近年来全球的经济水平和互联网技术都处于高速发展的状态,并且经济水平的发展离不开互联网技术的进步,各种新兴的互联网行业也在不断兴起。在这种趋势下,最明显的体现就是智能手机的出现,因此手机制造行业和互联网行业成为了学者们较为关注的两大行业。国内有很多企业抓住了这个机遇,构建了物联网行业下的盈利模式,有些企业已跻身行业前列,有些企业确连年亏损,这与该企业的盈利模式密切相关,本文将对小米集团的盈利模式展开
网络化是传统企业的发展大方向,传统企业将逐渐转化为互联网企业。O2O是传统企业继续生存的突破口,“互联网+”引领创业浪潮,是传统企业谋求发展的根本方向。在互联网时代,传
随着网络支付的迅速普及,民众出行时携带现金的比重在逐年下降,根据全球知名调研公司益普索2019年的一份调查报告显示,在受访的将近10万位中国人中,有25%的人已经不再携带现金出门,中国社会步入了“轻现金”时代,目前在公共交通领域,以杭州、上海为首的主要城市已经实现了移动支付全覆盖,而大连市作为东北主要城市,在此方面的建设速度较慢,直接影响了大连市的城市旅游印象和对年轻人的吸引力。因此,本文将运用社
资本市场的快速持续发展社会各界有目共睹,与此同时注册会计师在行业内受到了越来越多的关注和重视。此外,注册会计师审计已成为我国目前市场经济体制和监管体系建设的相关机制之一,这一机制大力推进了我国的市场经济体制和监管体系建设的良好发展。我国上市公司数量与日俱增,社会各界对注册会计师的需求也不断增加,外部审计整体质量问题日益突出。近年来,有许多关于公司财务相关欺诈行为以及上市后注册会计师审计失败的案例研
近年来我国职业教育发展迅速,尤其是作为职业教育体系重要组成部分之一的中等职业教育更是如此。中等职业学校(以下简称中职学校)是中职学生追求技能梦想的摇篮,但是却被愈演愈烈的校园欺凌事件影响了学生的学习和生活。中职学生有其特殊性,中职学生所承担的社会压力和学习压力跟普通高中学生是不同的,在外界看来他们的起点较低,因为中考失利不得不选读中职校,加之他们正处于身心发展的特殊阶段、所处学校教育环境的特殊性和
绿色行为指员工在工作场所中的环保行为。近期来,随着垃圾分类政策的出台落实以及美丽中国目标的推进,绿色行为成为管理心理学领域研究的一大热点。中国员工绿色行为的研究已有一定的研究成果,但仍然是不足的。员工绿色行为的许多前因变量仍然需要被发现与研究。员工组织支持感是一种较为主观的认识和体验,其与绿色行为的关系是本文探讨的重点。在绿色行为研究的理论意义和实践意义的指导下,本研究采用调查法,探讨员工组织支持