论文部分内容阅读
随着计算机在工业中的应用发展,电解铝行业在生产过程中普遍使用计算机监控系统,以达到对电解槽的自动控制。监控系统自动收集各种电解槽的数据,在铝生产行业中积累了大量的历史数据资料。但是现有数据系统的共享和整合程度低,只有简单的数据输入,查询,统计以及其他事务处理等功能,不能找到这些数据背后隐藏的在生产和企业管理中有重要指导作用的规则和规律。决策者迫切需要提取信息和知识,改善电解槽的管理质量,提高生产效率。为充分利用时间序列数据,从大型数据库发现隐藏的知识,本文对时间序列相似性聚类做了一系列的研究。主要的工作和贡献包括以下几点:1,在综合分析近年来时间序列数据挖掘相关文献的基础上从时间序列分割、相似性度量、时间序列聚类等方面对时间序列数据挖掘进行了综述,并在此基础上对未来的发展趋势进行了展望,为研究者了解最新的基于时间序列相似性聚类研究动态、新技术及发展趋势提供了参考。2.针对SAX(符号化聚合近似)等长分割的缺陷,提出一种基于分割模式的时间序列符合化表示方法(SMSAX).该算法根据时间序列特征对其进行不等长分割,同时加入波动率消除奇异点的影响。通过对标准数据集和铝电解数据的相关实验和分析,表明该算法能获得比SAX相对精确的结果,有效解决SAX等长分割的缺陷。3.针对时间序列角度距离相似性度量子线段长度信息丢失的缺陷,提出一种加权夹角距离相似性度量方法。该方法使用相邻线段夹角以及该相邻子线段长度所占比重构成的向量集合描述原始时间序列;并用相邻子线段所占比重作为权值,对时间序列进行相似性度量。通过对标准数据和铝电解数据的相关实验和分析,表明该方法有效避免了子序列长度信息的丢失,能够对时间序列进行相对准确的相似性度量。4.在对k-means聚类算法研究的基础上,基于序列整体相似性提取分割模式对时间序列线性分割,考虑序列特征的上界和下界,提出一种基于k-edge的时间序列相似性聚类算法。通过对铝电解槽况判断的相关实验和分析,表明该算法在聚类效率和聚类准确度都有着比k-means较好的效果。