基于聚类分析的可视化技术及其应用研究

被引量 : 0次 | 上传用户:gulujiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的进步特别是整个信息产业的快速发展,我们的社会进入了一个崭新的信息时代。不仅数据采集能力和手段越来越多样化,存储设备技术也迅猛发展,数据采集与存储设备的不断发展带来了大数据的时代。面对大量且繁杂的数据信息,如何从中提取出有价值且便于用户观察的信息是最迫切而重要的问题。显然要解决上述的问题,仅仅采用数据挖掘容易造成得到的信息不易被理解或不一定正确的问题,因而本文研究可视化数据挖掘技术,将数据挖掘和数据可视化技术结合在一起,相辅相成。目前可视化技术与数据挖掘算法的联系是较松散,针对这一现象,本文主要研究内容是如何将数据挖掘算法与可视化技术更好地更高效地融合,并以聚类分析算法为切入点将挖掘过程中的数据可视化、过程可视化及结果可视化进行相应的研究,同时也提供在社交网络、科学研究领域等方面的应用示例。主要研究内容如下:(1)提出了一种基于MASI距离的层次聚类方法,并融合了随机抽样的方法,对层次聚类算法进行了改进并将算法应用到职业网络数据集中实现了结果可视化。采用了随机抽样之后的层次聚类算法的时间复杂度有效地降低了,并且在聚类结果可视化以不同的树形图进行呈现,一目了然。(2)提出基于SOM聚类的可视化模型,并将模型应用到大气温度数据集实现聚类过程及聚类结果的可视化,并提出了基于聚类的兴趣度量和基于近邻的兴趣度量来对属性进行排名,优化了数据挖掘结果的可视化。值得一提的是该应用中的交互可视化设计,它结合了颜色映射、缩放等交互技术让用户更方便地进行观察和分析数据。(3)将平行坐标可视化技术与K-Means算法相结合,在实验过程中通过可视化技术同时对数据和挖掘结果进行可视化,从而提高了算法的效率和准确度。以Iris数据集为测试数据对K-Means算法可视化的有效性进行验证,实验表明相较于传统的K-Means算法,其效率和正确率都有较大的提高。
其他文献
本文研究的目的是比较研究中美高校在筹资渠道上存在的差异,分析中美高校目前存在的差异的原因,结合中国高校目前所处环境提出建议。首先,本在探讨国内外高校筹资渠道现状的
房价是当今最受人关注的一个社会话题。房地产价格的一涨一跌,牵动了无数人的心。房屋、土地是人类生存和发展的基本载体,这使得房地产业在国民生活和国民经济中占有重要地位
轮胎是汽车上最重要的组成部件之一,也是汽车上唯一与路面接触发生作用的部件。轮胎的振动和噪声会直接影响整车的行驶平顺性、乘坐舒适性和整车噪声。如何降低轮胎的振动和
随着时代的进步,我们的生活也发生着日新月异的变化,而红外探测器这种高端产品也越来越被人们所熟知。除了在军事领域广泛应用之外,也有越来越多的红外探测器开始应用于我们
在唐墓壁画的发展演变当中,玄宗时期的墓室壁画一直被认为是简化和式微的一个阶段,但通过全面考查,这一时期墓室壁画的内容和题材不能以此而概括。玄宗时期,壁画题材、内容和布局
本篇教学设计以第二语言习得理论、第二语言教学理论以及跨文化交际理论为理论支撑,主要从语言要素的教学入手,对教学组织形式、课时、生词、语法、课文、课后练习进行了具体的
2008年美国金融危机演变成全球的金融危机,这给全球经济和美国经济带来严重的冲击,以美国为代表的世界各主要经济体纷纷出台各种政策措施以应对金融危机。其中,美国自金融危
目的探析慢性阻塞性肺疾病(慢阻肺)呼吸衰竭行通腑法治疗的效果。方法 110例慢阻肺呼吸衰竭患者,以随机分组的原则分为观察组和对照组,每组55例。对照组给予常规治疗,观察组
货币政策作为调控宏观经济的重要手段,在促进经济增长、稳定物价方面发挥着不可替代的作用,因此,研究不同方向的货币政策在不同经济发展阶段的作用具有重要的意义。自20世纪3
隋唐时期,中国的佛教发展进入了兴盛期,并逐渐完成了中国化。山东作为隋唐时期佛教发展的重镇,具有研究的典型性。本文以山东地区为中心,将研究重点放在原始佛教文化与中国世俗文