基于PYTORCH的时间序列预测模型

来源 :锦绣·中旬刊 | 被引量 : 0次 | 上传用户:hhjscp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  时间序列预测是机器学习中一个非常重要的方向。本文主要介绍了在不同领域中训练基于PyTorch 的时间序列模型中的要点,包括对问题的限定、数据的预处理、模型的选择等,对于系统性能的提升有一定的指导作用。
  时间序列预测是一个富有挑战的领域。使用FlowForecast [1],可以用于训练出数百个基于 PyTorch 的时间序列预测模型,用于不同范围的数据集,如河流的流量,COVID-19,太阳能,风能等。本文主要讨论了训练这些时间序列模型时的要点。
  1.对问题加以限定
  对于使用基于机器学习的时间序列模型,通常有不同的定义:
  a)异常检测:这是用于在时间序列中检测出异常值的通用方法。然而“异常值”通常只出现在数据集中的很小一部分,但却与其它数据点截然不同。虽然二值检测通常那被认为是另外一个领域,异常检测可以被认为是二值检测的极端形式。大部分的异常检测都是无监督学习,因为我们通常只有在异常数据出现时才有可能判别出那是异常的数据。
  b)时间序列分类:与其他形式的分类问题类似,我们将时间序列中的一段拿出来,然后将它分成某一类。与异常检测不同,通常每一类样本的数量都更加平衡(尽管有时候有些倾斜,如 10%,80%,10%)。
  c)时间序列预测:通常指的是预测时间序列数据中的下一个值,或后面的 n 个值。这也是本文分析的重点。
  D)时间序列分析:这是一个可用于包括以上各个分类的词。然而,通常可以认为是检查整个时间序列数据,比较不同的时间结构,然后设计出一个预测的模型。例如,如果设计出一个时间序列的预测模型,那么就可以得出时间序列中的因果关系因子,然后做出更深入的时间序列分析。
  在开始之前,我们应该明确问题是一个预测问题,还是一个分类问题。有时候将一个预测问题变成一个分类问题更加合适。例如,预测的具体值并不重要时,可以将其分入某个区间变成一个分类的问题。更进一步,应该明确部署的问题,并明白最终的产品是什么。如果是需要一个毫秒级延时的股票交易系统,那么 20 层的 transformer 模型就一定不能满足标准。
  2.数据质量与预处理:
  a)通常要对数据归一化:在 99%的情况下,数据归一化或者正则化都能提高系统的性能。使用 FlowForecast 可以很方便地实现这一步。缺少了数据归一化,会出现损失函数爆炸的情况,尤其当训练某些 transformer 的时候。
  b)重新检查空值,不恰当编码或者缺失的值:由于数据的质量问题,会导致浪费很多的时间。有时候缺失值会使用一种奇怪的方式进行编码。例如,有的气象站将缺失的降雨值设置为-9999。这会导致很多的问题,因为一般的缺失值检查处理不了这个问题。FlowForecast 中提供了对缺失值进行插值的模块,也能对可能不正确的录入数据进行警告。
  c)开始只使用少量的特征:通常开始使用较少的特征,然后根据性能增加特征是更好的做法。例如,当预测 COVID 的变异时,开始仅仅使用死亡数据和新增数据。随着时间的推移熟悉了超参数之后,可以增加天气的数据。
  3.模型选择和超参数选择
  a)对于时间的滞后项进行可视化分析:在时间序列分析中,将不同的时间滞后项输入模型将导致不同的结果。通过调整参数,模型的结构改变,能学习到更长的依赖关系。然而,确定初始的范围是十分必要的。在某些情况下,长的依赖关系并没有什么作用。
  b)以 DA-RNN 开始建模:使用DA-RNN可以得到一个很强的基准值。使用 transformers 可以超越 DA-RNN,但是那通常需要更多的數据,以及更加仔细的调参。
  c)确定预测的长度:这是一个需要使用技巧搜索的超参数调整问题。这个问题是要确定模型一次预测的时间步长。可以基于上一次的预测结果叠加出更长的预测。一方面,如果要预测出更长的时间范围,可以直接将预测的误差加权加入损失函数;另一方面,使用太长的时间预测将使得模型的性能下降。在大部分的预测中,更短的预测时间通常效果更好。
  d)以较低的学习率开始:对于大部分的时间预测模型,使用较低的学习率。
  e)Adam 算法通常并不是最好的:在有的情况下,别的优化算法表现更好。例如,Bertadam 对于 transformer 型的模型比较好,一般的优化算法对DA-RNN 就足够了。
  4.鲁棒性
  a)在不同的实验场景进行仿真并分析。在不同的环境下对时间序列进行预测相对简单,例如,要预测河流的流量,可以尝试输入比较大的降雨量,看模型的输出。
  b)仔细检查热力图和其他可解释性度量。当模型表现相对比较好的时候,要通过热力图检查模型是否使用重要的特征。如果不是,模型则不是使用真实的特征之间的因果关系,而仅仅只是记住了某些特征。
  5.结论
  时间序列预测是一个富有挑战的领域,尤其是基于机器学习的模型。本文所提到的要点对于提高系统的性能有一定帮助。
  参考文献
  [1] https://github.com/AIStream-Peelout/flow-forecast
  作者简介:罗晓牧(出生年月:1980-),性别:男,广东省广州市(籍贯),现职称:副教授,学历:工科博士研究生毕业,研究方向:机器学习,无线传感器网络,生物信息获取。广州中医药大学医学信息工程学院.
其他文献
摘要:工业互联网的构建对我国工业生产具有重要作用。而5G技术的出现,可以实现工业互联网的万物互联,实现工业互联网信息共享,通过5G网络高品质、高速率、高宽带的特征,推动工业互联网更好地融入到移动环境中。5G系统在工业互联网中的应用,可以改变传统工业领域的限制,扩大工业制造商的业务范围。鉴于此,本文主要分析5G技术在工业互联网领域的应用。  关键词:5G技术;工业互联网;应用  1、引言  工业互联
期刊
摘要:在现代科技发展过程中,实验室建设对对它所在行业及国民经济发展具有一定的影响,而在具体进行实验室建设时,各项仪器设备对其整体建设效果具有很大的影响,此时,管理人员需要对仪器设备加强管理,定期进行维护更新,确保能够随时使用各项仪器设备,保障仪器设备的使用效率,进而对其实验效果进行有效的保障,推进相关行业的进一步发展,本文综合探究对仪器设备加强管理的具体策略,希望能够使其整体管理水平得到有效提升,
期刊
摘要:白沙绿茶作为享誉国内的特色品牌,以其特有的品质受到消费者的喜爱,然而受到地域的局限性,未能形成完善的栽培技术体系,因此,本文通过对白沙绿茶的种植、种植技术进行总结和分析,提出高产、优质、安全的白沙绿茶栽培技术,为促进白沙绿茶的发展和提高产品竞争力提供参考。  关键词:白沙绿茶;栽培;技术  白沙绿茶是特有的绿茶品种,其独特的自然条件成就了白沙绿茶区别于其他绿茶的独特品质。白沙绿茶色泽润绿有光
期刊
摘要:壮锦文化是广西壮族特有的文化之一,最能代表我国西南壮族地域的特色文化,具有传统学术价值和文化语言特征的工艺纺织艺术品。该壮锦具有顽强的生命力和传承性,所以本身包含很高的价值性,源远流长的特色图案文化内涵值得去深入研究设计。古为今用,不断地创新和结合现代设计特征,用大众审美的眼光进行壮锦对包装设计上的应用和设计。  关键词:壮锦;包装设计  一、壮锦元素在包装创意产品中的发展现状:  壮锦文化
期刊
摘要:本文将激励机制在高校人事管理中的研究作为着重点,依凭近些年激励机制在高校人事管理中的研究的现状,来尝试论述如何科学运用激励理论,并调整和补充激励理论的机制,从而来激起教职工的工作热情和工作欲望,尤其是在科研人员方面,尽可能地开发他们的潜力和创新力,并不断地吸引全方位的高素质人才,来提高高校的教学质量和教学水平。  关键词:激励理论;高校人事管理;运用研究;  在教育水平不断发展的背景下,为了
期刊
摘要:随着信息化技术的不断发展,防火监督工作中不断应用了信息化技术,对消防救援队伍的工作质量带来了很大的提高。在此背景下,本文对当前防火监督工作中存在的问题进行探析思考,结合新时代信息化技术的发展,给出了一些提高防火监督工作质量的建议。  关键词:信息化技术;防火监督;应用  引言:  消防安全作为社会安全的保障,一直以来都是备受关注的,但是尽管消防救援机构不断努力,火灾事故还是屡次发生。所以消防
期刊
摘要:图形是平面设计中的重要部分,其主要就是以一种比较直观的形式将信息传递给观众,可以快速吸引观众的视线,确保观众能够理解平面设计的意图。为发挥图形在平面设计中的价值,本文主要针对平面设计中的图形应用进行分析探究,希望能为平面设计的发展提供有利依据。  关键词:平面设计;图形;应用  近年来,随着我国设计行业的快速发展,平面设计的发展水平受到高度关注,而图形是当前平面设计中比较重要的一个部分,其中
期刊
摘要:我国是茶叶的起源地,制茶饮茶历史悠久。茶作为世界三大无酒精饮料之一,受到了世界各国人民的喜爱。为了更好地满足社会不断增长的茶叶需求,积极推动茶叶加工技术创新发展十分必要。当代茶叶加工产业中已经集合了诸多现代化技术和设备,极大地提升了茶叶加工效率和质量,为社会提供了更多高品质的茶叶资源。本文主要纵观我国茶叶加工技术发展情况着手分析,反馈目前我国茶叶加工技术的不足,推动技术自主创新发展。  关键
期刊
摘要:水土资源是人类赖以生存的基本条件。在当前城市开发建设过程中,如果没有采取有效的水土保持措施,就会导致水土资源流失现象的发生。特别是在黄土高原地区,在城市公园施工过程中,会改变原有地貌,破坏地表植被,扰动地标,可能引发严重的水土流失问题。因此,在城市公园施工中,必須做好水土保持措施。本文以西安市长安区城市公园建设为例,探讨水土保持措施,以供大家参考。  关键词:城市公园施工;水土流失;水土保持
期刊
摘要:在历经市场改革多元化发展环境下,国有企业所面临的党建工作面临着全新的发展挑战。石油企业是国有企业的重要组成部分,在维护社会安稳、保障国家能源安全等方面中均发挥不可替代的作用。党建工作是推动石油企业发展的重要保证,更是强化石油企业核心竞争力关键所在。为此,本文对于石油企业党建工作开展的相关内容进行研讨分析,旨在实现党建工作与石油企业的紧密结合,推动石油企业的快速稳定发展。  关键词:石油企业;
期刊