基于双曲切比雪夫逼近的聚类方法研究及应用

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:moreee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,数据挖掘已经取得了显著进展并得到了广泛的应用。随着研究的不断深入,对于序列数据的挖掘逐步受到了国内外研究人员的广泛关注。而聚类分析作为数据挖掘中一种无监督或半监督的学习方法,同样得到广泛应用。K-means作为一种经典的聚类算法,在被用于处理序列数据时同样存在初始聚类中心的随机选择、迭代计算聚类中心鲁棒性不强的问题。针对上述问题,本文对序列数据的聚类方法开展了研究,主要研究成果如下:(1)针对初始聚类中心随机选择的问题,本文提出了一种基于切比雪夫双曲线逼近的初始聚类中心构造算法(TC-means)。该算法首先将每一类数据用滑动窗口进行分段;其次在每段数据上采用基于切比雪夫双曲线逼近方法得到该段的中心函数,并计算每个维度的数值;最后利用相邻两段的共用点完成序列数据的拼接,得到较为理想的聚类初始中心点。实验结果表明用该方法构造的初始聚类中心进行聚类分析克服了K-means算法对初始聚类中心的敏感性,并与其它聚类算法比较表现出了更好的聚类性能。(2)为了降低TC-means算法时间开销提升大规模序列数据的处理能力,改进了各子簇迭代过程中聚类中心更新方式,提出了一种新的序列数据聚类算法(FTC-prototype)。该算法将切比雪夫双曲线逼近思想用于每次迭代时聚类中心的更新操作,并引入针对切比雪夫双曲线逼近的迭代终止条件,从而减少了迭代次数。实验结果表明该方法有效提高了序列数据聚类的时间效率。(3)在上述研究的基础上,根据恒星光谱数据具有严格序列的特性,将其作为序列数据处理,设计并实现了一个恒星光谱数据聚类分析原型系统。介绍了系统相关模块和功能,运行结果表明该原型系统的有效性,为恒星光谱数据聚类分析提供了一种新途径。
其他文献
人类文明的探索离不开考古,古书籍更是占据重要地位,其文物的破损原因纷杂,依靠人工识别文字信息,工作量巨大,且时间长,效率低。随着计算机应用在考古研究中的不断深入,其研究方法愈加向智能化,信息化,综合化发展。在实际研究中,古书籍文物文字信息的破损可视为古汉字图像与遮挡图像的混合,即仅一张混合图像为可研究对象,没有混合方式的先验知识,而单通道盲源分离(single-channel blind sour
随着网络技术的发展以及多媒体设备的日益普及,网络上的数据资源正在突飞猛进地增长。其中,图像作为信息传播的核心,可以传递更为丰富的语义,极大地丰富人民的工作和生活。人们可以通过检索关键字的方式搜索到他们需要的图像数据,然而大量的无标签图像限制了用户对它们的利用。在这种情况下,图像自动标注技术顺应时代而生。目前,在图像自动标注领域主要是利用传统的机器学习方法和深度学习方法来搭建标注模型。然而,传统的机
液压控制技术广泛应用于液压升船机、多自由度试验平台等重载长行程单出杆液压缸控制系统,这些控制系统不仅控制性能要求高,而且节能意义重大。但是,当前泵控回路虽然能耗低、工作效率高,但动态特性较差;传统阀控回路虽然控制精度高,但能量利用率低。因此,课题组结合泵控回路具有高效能和阀控回路具有高性能的特点,提出泵阀并联驱动非对称液压缸控制回路。在泵阀并联驱动非对称缸系统中,泵阀两个回路之间不仅相互协调,也会
科学技术的发展提高了人们的生活质量,人们对高生活质量的追求又推动着科学技术不断向前发展。对高质量图像的需求,推动着计算机技术和数字光电成像技术的不断发展,也大量的涌现出了各种各样的数字光电成像设备,图像相关技术的发展为人类视觉获取信息做出了巨大的贡献。但是目前图像质量问题仍然非常严峻,图像仍然会出现各种形式的退化,在图像的成像、传输、存储的过程中由于环境和电子设备的不完善,很容易造成图像质量差的问
RH真空循环精炼涉及到传质、传热、化学反应和气-液-固多相流等多方面;其精炼效果的取得是依靠气相吹入带动钢液在RH精炼装置中的循环流动来实现的,气液两相的流动是RH精炼的主要流体动力源泉,所以研究RH反应器内气液两相流的行为,探究各因素对气液两相流流动的影响,对改善精炼效果提高RH精炼效率至关重要。故本课题采用物理模拟和数值模拟两种研究方法对RH精炼设备内气液两相流的行为特征进行研究,为有效提高R
复合型微波吸收材料,特别是碳基复合型微波吸收材料,具有较高吸收强度、低密度、良好物理化学稳定性、吸收频带宽等优点,因而其在电磁波污染防护及隐身材料等领域具有广阔的应用前景。目前广泛报道的碳基体存在制备周期长、产量小、原料有毒等缺点,大大限制了碳基复合型吸波材料的实际应用。煤矸石(CG)是煤矿开采过程中产生的一种有害的固体废弃物,若能以其为含碳载体制备复合型吸波材料,必将大幅降低成本,同时为煤矸石的
生产调度和系统维修是生产过程中的两个重要活动。在传统调度的研究中,常假设系统持续可用。然而,在实际生产加工过程中,系统会因为受到作业环境、对象等因素的影响而逐渐劣化,若不及时维修干预,最终会导致系统故障。诸多学者在对调度与维修进行研究时,多从系统整体出发,忽视了系统内多部件的劣化及相互影响。现代生产系统结构趋于复杂,诸多系统由多个关键部件组成,如生产制造车间中由多个钻头组成的群钻机床,任意钻头的磨
近年来,各种类型的电子封装产品都朝着微型化、高集成度和高可靠性的方向发展,POP堆叠式电子封装(Package On Package,简称POP)已经开始越来越广泛地应用到包括智能移动手机、智能平板电脑、车载芯片以及航空航天等各个领域之中。由于POP堆叠封装高集成性的结构特点,其本身对于温度变化与振动的载荷较为敏感,封装体在多数实际工况下又常常面对温度循环与振动载荷同时加载的情况,因此,热振情况下
斜盘式轴向柱塞泵工作时,柱塞腔会经历高低压连续切换。当压力由低压变到高压时,柱塞底部受到高压力的瞬时冲击,可能使得滑靴与斜盘发生直接接触,破坏润滑,进而影响柱塞泵的寿命。滑靴与斜盘之间存在着润滑油膜,这层油膜的存在避免了柱塞滑靴组件在受到柱塞底部压力冲击时发生直接接触,对滑靴起到了润滑与支承的作用。研究滑靴副油膜的润滑特性对于提高柱塞泵的整体性能具有重要意义。本文以斜盘式轴向柱塞泵滑靴副润滑油膜为
镁合金已经广泛应用于各行各业。AZ80A镁合金拥有塑性好、强度高、性能好,并且具有价格优势,已成为最受欢迎的变形镁合金之一。本文以挤压态的AZ80A镁合金棒料为原材料,选择的制备半固态坯料的方法为应变诱发熔化激活法(SIMA),采用相应的测试表征方法研究了保温温度与保温时间对半固态AZ80A镁合金微观组织演变的影响规律;采用Gleeble3800热模拟试验机对半固态AZ80A镁合金在598K-67