论文部分内容阅读
摘要:针对建筑能耗数据成因复杂,及能耗数据样本不足,导致现有建筑能耗预测模型不精确等问题,结合迁移学习和强化学习中的Sarsa学习方法,提出一种基于降维式自主迁移强化学习的建筑能耗预测方法——STRL。该方法通过提取影响建筑物能耗的重要维度进行降维,采用欧式度量对满足迁移条件的原始建筑MDP状态进行迁移,结合Sarsa算法构建能耗奖赏函数,实现能耗预测。将所提出的STRL与VFT-HSA1以及FTRL2方法用于模拟建筑物能耗问题进行对比实验,实验结果表明,STRL具有较快的收敛速度以及较好的收敛精度。
关键词:迁移学习;强化学习;降维;建筑能耗预测
中图分类号: TP181
关键词:迁移学习;强化学习;降维;建筑能耗预测
中图分类号: TP181