基于ASA的一个动态聚类算法及其有效性

来源 :延边大学 | 被引量 : 3次 | 上传用户:weixiant241
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是研究在没有训练样本集的情况下对样品进行分类的多元统计和数据分析方法。利用聚类分析方法对给定数据进行分类时,所采用的样品并不知道其所属类型,而根据样品间的“相似”程度来自动地进行分类。聚类分析的主要目的在于把给定数据集按照一定的规则适当地划分成一系列有意义的子集(或称类(clusters)),使得每个类中的数据之间尽量“相似”或(“接近”),而处在不同类的数据尽可能有“较大差异”。一个好的聚类结果,一方面可对给定的数据按其固有的性质所分成的各个类去把握其特征,从而达到浓缩原来数据规模的目的。另一方面可从结构相对复杂的原始数据集得到结构更加简单而直观的数据资料,以利于对给定问题作进一步讨论和研究。 一般地,对实际问题的讨论中事先对给定数据的结构及具体的聚类个数等信息掌握的不够充分(有时甚至是一无所知),确定客观而准确的聚类往往是一个非常复杂的问题。同时,很多动态聚类算法普遍存在聚类结果对初始分类依赖性大的问题,这导致算法有可能只收敛于局部最优解。该论文主要通过对一般模拟退火法(simulatedannealing)的分析和讨论,提出一个改进方案和相应的改进算法,并把其理论和方法应用到聚类分析中,提出一个基于“加速模拟退火法(acceleratedsimulatedannealing(ASA))”的动态聚类算法,以克服K-均值法等传统动态聚类法所存在的部分问题。并提出聚类数动态可调算法,为同步解决聚类与确定适当聚类个数的问题提供一些设想。最后通过仿真研究和实际问题的分析讨论,比较不同聚类法的分类效果和选择最优解的收敛速度等,并进而验证所提出聚类法的有效性。
其他文献
本论文给出了在一个较弱条件下的一种精确Gross-Zagier公式.特别的,我们还推广了Gross在文章”X0(N)上的Heegner点”中的工作,考察更为广泛的模曲线上的Heegner点的性质.通过运
在过去的二十年里,自适应方法的研究发展非常迅速。在相当多的实际问题中,由于解的奇异性质的存在,传统的一致网格计算会极大地浪费计算机资源,并使得数值求解无法实现。相反地,通
学位
IPSec协议是TCP/IP协议的网络层安全标准,也是VPN网络的重要实现技术,被广泛应用于路由器、防火墙产品以及Windows等主流操作系统中。IPSec安全网关主要处于VPN网络中企业内部
非线性Sehr(o)dinger方程出现在物理的许多领域.例如一群全同的粒子在超冷状态下相互作用,Schr(o)dinger方程近似地描述了粒子相互影响的演化.许一多学者对不同形式的Schr(o)din
复合材料周期结构电磁特性分析在通讯、航空、航天、微电子器件等领域有广泛的应用,研究具有周期间断系数Maxwell方程组电磁散射问题的多尺度算法在理论研究和工程应用方面有
随着网络通信技术的飞速发展,计算机数据加密在日常生活中越来越重要。数据安全不仅仅在军事部门和国家机关中受到重视,在商业领域也显得突出。保证数据安全的重要手段之一是使
利率波动率是指利率变化的标准差,用来衡量利率波动的不确定性,它是利率一个相当重要的指标,也是金融市场上一个很重要的价格变量,与利率衍生品的定价、非衍生品的定价以及利率风
安全是信息系统的关键性问题之一,硬件密码组件是实现信息安全的重要基础。本文在参考我国立法对信息安全的界定和《PCI密码卡技术规范》的基础上,从密码卡的系统安全和数据安
在前人工作的基础上,本文研究了两片及多片张量积B样条曲面光滑拼接的算法,并以此为基础,给出了N面角点处曲面实现G1连续的算法。用双三次张量积B样条曲面给出了计算实例,验证了