论文部分内容阅读
时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列,它是很多复杂系统工作或运行状态的主要外在表现形式,蕴含丰富的系统结构和动态演化规律等信息。很多风工程的应用,例如风能的预测、大型建筑的抗风设计与优化、空气污染物的传播与扩散等,都需要精准地掌握应用风场的流动及演化特性。但在很多实际应用场合记录自然风场变化的风速和风向时间序列呈现出复杂的非线性和非平稳特征,这给上述风工程应用带来了极大地困难和挑战。由于模型和理论的不完善,常规的物理学建模存在很大的局限性。为此,本文拟从数据驱动的角度深入地揭示复杂气态流场的流动规律,重点研究自然风场时间序列的复杂性和模式分类技术,为相关风工程的应用提供重要的理论和技术支撑。论文的主要工作如下:一、本文针对时间序列两类主流方法(时域法和频域法)存在的不足,提出了一种新型的二维可视状态图的时间序列量化分析方法。该方法首先将一维时间序列映射成二维可视状态图,并在此基础上定义了多个可视状态图量化分析指标,实现对复杂时间序列的量化分析。将本文方法应用于室内外两类不同环境的风场时间序列分析。测试结果表明,一般情况下室内风速时间序列的复杂性小于室外风速时间序列的复杂性。可视率VR、确定度D等量化指标可以较好地区分室内、室外风速信号。该方法从时间序列图模式的角度,能有效、精确地刻画不同时间序列之间的差异程度,从而为复杂信号的相似性度量提供了全新思路。二、针对幅度呈现出跳跃式变化规律的一类时间序列信号,综合考虑信号符号模式的关联程度和方向性差异,本文提出了一种新的基于时间序列符号化结合滑窗技术的复杂性测算方法。首先依据跳变数据的等概率分布对时间序列进行符号化处理,从而保障对原始信号精度损失较小的前提下大大简化分析信号的难度;然后利用滑窗技术获得有限个数的不同符号化模态,通过计算符号化模态之间的转换确定事件,统计符号化模态之间的转换频次以计算符号化模态之间的转换概率;最终实现对复杂信号进行复杂性测算。通过对典型时间序列分析结果表明,本文提出的复杂性测算方法不仅能直观地区分周期信号和混沌信号,且能准确地反映周期时间序列和混沌时间序列的细微变化。最后,将本文方法分析规则排列方式采集的风速时间序列信号,测试结果不仅能够有效、直观地区分室内外信号,还能较准确地预测风速仪的空间位置邻近关系。三、提出了卷积神经网络(Convolutional Neural Networks,CNN)与支持向量机(Support Vector Machines,SVM)相结合的近地面风场时间序列分类方法。并与传统的分类方法:密度峰值快速搜索聚类算法和C均值模糊聚类作对比。传统方法在处理小数据集合时是有效的,但是过于依赖初始值的设定,并且针对大数据集和高数据维度的样本传统的分类工具难以满足大数据挖掘的需要;本文使用的CNN+SVM模型的无监督分类结果明显优于传统分类方法,错误率降低至12.6%。