【摘 要】
:
信息化是当今世界经济和社会发展的大趋势,其所产生的信息量也是非常巨大的,研究如何从这些海量数据中快速准确地获取有价值的数据信息已经成为当前科学研究领域的一个热点。
论文部分内容阅读
信息化是当今世界经济和社会发展的大趋势,其所产生的信息量也是非常巨大的,研究如何从这些海量数据中快速准确地获取有价值的数据信息已经成为当前科学研究领域的一个热点。数据挖掘技术就是顺应时代的需求而产生的。人们通过运用数据挖掘技术可以发现大量的实用价值非常高的信息,而且人们通过使用这些有价值的信息能够促进科技进步和创新,推动社会向前发展。聚类分析是数据挖掘中的一个重要技术和工具,人们对聚类技术的研究已经比较成熟,提出了很多经典的聚类算法,现在它已经在多个领域中得到广泛地应用,例如模式识别、市场调查研究、图像图形的分析与处理、数据的分析与处理、医学分析与诊断等领域。而聚类边界分析又是聚类分析的一个研究热点,在聚类分析、图像检索、医学分析等领域中已经发挥着举足轻重的作用。现在对于聚类边界点的研究才刚刚起步,而且现有的聚类边界点检测算法仍然存在着不能正确区分噪声和边界点,不能检测多密度数据集等一系列的问题,而且算法运行效率较也比较低。
针对现有的边界点检测算法的缺点和一些不足,本文提出了一种新的基于高斯分布的边界检测算法MARGIN。
MARGIN算法充分利用了高斯分布函数和变异系数相结合的方法来提取聚类的边界点。数据密度的分布情况可以通过使用高斯分布函数来反映,然后通过高斯分布函数来计算出来数据在该区域的具体密度数值,最后再利用变异系数来提取出数据的全部边界点。经过对比分析实验结果,表明该算法能够非常快速地、准确提取出来不同形状、大小和密度的数据集中的聚类中的真实的边界点,并且本算法能够去除噪声所产生的干扰。
其他文献
WSNs是一种大多部署在野外无人区,网络节点资源极其有限,网络结构动态拓扑、自组织,网络生命周期也因节点生命周期影响很大的无线网络。这些特性都使得WSNs的路由通信和安全
随着互联网大数据的快速发展,网络上的文本数据和网页数据呈现几何级增长,为了从海量的文本数据中快速准确地获取潜在的信息,需要对文本进行更精确更深层的类别标注和主题理
光纤传感器是伴随着通信技术的发展而产生的,它是以光作为信息载体,以光纤作为传输媒介的一类新型传感器。由于传统的传感器自身的特点和传感原理,不能完全满足在安全检测问题上
随着当今信息技术的发展,手机作为一种便携式的移动计算设备,它所拥有的功能越来越强大,款式越来越新颖,价格却越来越能够为大众所接受,因而手机如今已经非常的普及。现在市面上流
FMIPv6协议是基于移动IPv6的新型协议,转交地址NCoA提前配置好。MN到达目的网络后,便可直接使用NCoA与通信对端CN进行数据包的传送,减少了通信的中断时间。同时,该方案通过隧
近年来,随着互联网的普及与电子商务技术的发展,面向服务的计算(SOC)和面向服务的体系结构(SOA)正逐步变为未来软件发展的一种趋势,也已成为学术界和工业界共同关注的一个研究热
IPTV系统又叫交互式网络电视,是一种利用宽带有线电视网,集互联网、多媒体、通讯等多种技术于一体;向家庭用户提供包括数字电视在内的多种交互式服务的崭新技术。它可以方便的向
ERP系统是对企业的各种信息和资源进行全面集成,集中管理的软件系统。ERP借鉴了先进的现代化企业管理思想,集成了企业所有的信息和资源,为企业提供决策、控制、计划、运营等信息
随着全球云计算技术日渐成熟和云服务的日益普及,作为云计算基础设施的数据中心的能耗问题也日益突出。在我国,数据中心能耗目前占全国电力消耗的1%,虽然这一比例呈快速增长趋势,
随着技术和社会的进步,图像成为越来越重要的信息载体,如何对图像信息进行有效的处理成为目前研究越来越重要的内容,为了能让计算机快速合理的处理各种图像信息,有必要对图像进行