论文部分内容阅读
为了充分利用历史数据,从大型数据库中寻找历史时间序列数据隐藏的知识,本学位论文对面向相似性的时间序列表示和搜索方法进行了细致的研究。本文在研究各种相似性定义的基础上,提出了一种较为统一的时间序列相似性概念体系,在该概念体系内,相似性被定义为依赖于某种相似性度量函数和变换约束的概念。,相似性带有一定的“主观性”,即相似性只能是在某种变换约束下的相似性。从而将相似性问题归结为寻找合适的变换函数和相似性函数的问题。解决相似性搜索问题的关键在于寻求某种鲁棒性强且计算复杂度低的时间序列近似表示方法。本文围绕着算法的快速性、降维效果、准确性、一致性和动态性等要求,实现了如DFT、DWT等整体正交变换方法;PAA、界标模型等特征提取方法;并且提出了一种自顶向下的基于局部极值特征抽取的时间序列表示方法并验证其在速度方面的优越性。另一方面,本文在结合时间序列相似性比较和分类的两个实例分析中,进一步验证了该算法的正确性并阐述了面向相似性时间序列表示方法的简单应用。在时间序列数据库的索引和查询方法的研究中,本文分析并给出了R*-树的索引架构生成、搜索、删除和查询的相关算法;提出了建立基于局部极值特征抽取的时间序列表示方法和DFT结合的多级混合索引方法,从而达到能够快速、准确地完成相似性搜索并且给出了混合索引的建立和搜索算法以及分级识别的原理结构。本文还对于在相似性查询过程中必要的环节如匹配模式、分类算法和查询中可能存在的问题作了详细地分析。面向相似性的时间序列搜索和查询有着广阔的应用前景。本文对该分析方法在机械设备故障预诊断方面的应用进行了探索性研究,提出了独立于设备故障机理研究和信息采集技术的利用面向相似性的时间序列搜索方法完成故障预测和识别的应用思路,分析了其可能性、技术难点以及系统实现的主要途径。