时间序列相似性聚类算法研究

被引量 : 0次 | 上传用户:weihan0533
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机在工业中的应用发展,电解铝行业在生产过程中普遍使用计算机监控系统,以达到对电解槽的自动控制。监控系统自动收集各种电解槽的数据,在铝生产行业中积累了大量的历史数据资料。但是现有数据系统的共享和整合程度低,只有简单的数据输入,查询,统计以及其他事务处理等功能,不能找到这些数据背后隐藏的在生产和企业管理中有重要指导作用的规则和规律。决策者迫切需要提取信息和知识,改善电解槽的管理质量,提高生产效率。为充分利用时间序列数据,从大型数据库发现隐藏的知识,本文对时间序列相似性聚类做了一系列的研究。主要的工作和贡献包括以下几点:1,在综合分析近年来时间序列数据挖掘相关文献的基础上从时间序列分割、相似性度量、时间序列聚类等方面对时间序列数据挖掘进行了综述,并在此基础上对未来的发展趋势进行了展望,为研究者了解最新的基于时间序列相似性聚类研究动态、新技术及发展趋势提供了参考。2.针对SAX(符号化聚合近似)等长分割的缺陷,提出一种基于分割模式的时间序列符合化表示方法(SMSAX).该算法根据时间序列特征对其进行不等长分割,同时加入波动率消除奇异点的影响。通过对标准数据集和铝电解数据的相关实验和分析,表明该算法能获得比SAX相对精确的结果,有效解决SAX等长分割的缺陷。3.针对时间序列角度距离相似性度量子线段长度信息丢失的缺陷,提出一种加权夹角距离相似性度量方法。该方法使用相邻线段夹角以及该相邻子线段长度所占比重构成的向量集合描述原始时间序列;并用相邻子线段所占比重作为权值,对时间序列进行相似性度量。通过对标准数据和铝电解数据的相关实验和分析,表明该方法有效避免了子序列长度信息的丢失,能够对时间序列进行相对准确的相似性度量。4.在对k-means聚类算法研究的基础上,基于序列整体相似性提取分割模式对时间序列线性分割,考虑序列特征的上界和下界,提出一种基于k-edge的时间序列相似性聚类算法。通过对铝电解槽况判断的相关实验和分析,表明该算法在聚类效率和聚类准确度都有着比k-means较好的效果。
其他文献
基督教教派众多,各教派在中国的传播与发展一直是学界非常关注的热点问题。本文以基督教一个较小的教派——真耶稣基督教会为对象,运用宗教人类学田野调查的方法,对河南省荥
宗教是人们应对日常压力、危机的重要资源,将宗教的思想和行为用于压力应对的过程正是宗教应对,这一现象在占我国基督徒比例较大的农村信徒群体中更为普遍,本研究采用结合定
土耳其共和国地跨欧亚大陆,扼守土耳其海峡,是黑海进入地中海的通道,其地理位置具有重要的战略意义。这个97%的领土在亚洲的国家,目前比较有影响力的身份是北约成员国,美国在
本论文以呼和浩特教会活动为例,阐述了近十年来基督新教在内蒙古蒙古族中的传播和发展现状,并对基督教在呼和浩特蒙古族中的传播、教会的组织结构和信徒的信教原因与信徒结构
目的:探讨1mg非那雄胺口服联合5%米诺地尔搽剂外用联合治疗男性雄激素性脱发(AGA)的临床疗效。方法:选取我院皮肤科门诊就诊的72例男性AGA患者,单一治疗组(44例)治疗采用5%米
镁合金是近年来在工程领域应用广泛也是最轻的金属材料,广泛地应用于各个领域。因为镁合金自身的一系列特殊的物理性质,导致在激光焊接过程中极易出现气孔、晶粒粗大等问题。
从儿童的消费心理、玩具包装趣味性的价值和儿童玩具包装趣味性的表现这3个方面来阐述儿童玩具包装的趣味性,并列举一些学生的作品和各种实例来进行分析。
马克思和恩格斯在《德意志意识形态》中第一次阐述了唯物史观的基本原理,批判了唯心史观的谬误,奠定了唯物史观审视历史的原则。这篇经典文献主要从人、人的活动、人的活动方式
二十一世纪是信息的社会,信息作为社会最主要的资源,将成为战略资源引起人们广泛的关注。如何获取信息?图书是我们最好的获取信息的方式,但随着图书馆图书收藏量的不断增加,
有效市场假说是现代资本市场理论的重要基石,其他现代资本市场理论都是在其基础上发展起来的或与之密切相关.但是,自20世纪80年代以来,行为金融理论对有效市场假说发起了挑战