基于孤立森林算法的集中供热系统异常数据识别研究

来源 :天津大学 | 被引量 : 1次 | 上传用户:yaozi303
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前人工智能等技术飞速发展的背景下,供热系统的运行调控、监测记录功能也在不断完善,积累了大量的数据。采用合理的数据挖掘方法,可以有效发现集中供热系统特性。然而由于多种因素的制约,数据集中往往存在一定数量的异常数据。数据中包含的错误信息对分析供热系统物理特性存在诸多干扰,因此对集中供热系统大数据引入异常识别技术是非常有必要的。本文首先针对当前用于集中供热系统异常识别模型验证数据集不足的情况,依据经验和相关物理平衡关系采用人工标定的方法,对四个换热站总计约5万条供热数据进行标定,得到了带有异常标签的验证数据集。其次,采用孤立森林算法(IF算法)对单个换热站验证数据集进行异常识别,验证了孤立森林模型性能。继而详细分析了数据集维度(参数数量)、数据本身物理规律以及孤立森林算法设定参数变化对模型性能的影响规律。分析结果表明:数据集存在冗余信息或者剔除信息过多都会使最终的识别结果变差。通过优化数据集参数数量,可使模型AUC数值提高8%~10%。此外,针对集中供热系统运行调节所导致的部分正常数据误诊率高的问题,提出了数据集参数相对化的方法,该方法可以相对降低12.5%的模型误诊率和44%的漏诊率。通过对比不同IF算法设定参数下的模型性能,给出了IF模型设定参数的推荐范围。最后,为了解决集中供热系统数据集中包含的冗余信息以及各个参数之间存在不同程度信息耦合会影响IF模型性能的问题,提出了PCA—IF算法。该算法不仅可以有效剔除数据集中的冗余信息,而且可以保证数据信息的完整性,使模型识别性能显著提高。利用另外三个换热站的年数据集对PCA—IF算法和LOF算法进行异常数据识别性能对比。结果表明:PCA—IF模型计算时间仅为LOF模型的5%~9%;PCA—IF模型AUC数值相对LOF模型AUC数值提升6%~90%。
其他文献
木结构建筑无论是在建造过程还是在使用过程中,所产生的能耗均低于砖石结构和钢混结构的建筑,符合国家提倡的资源节约型、环境友好型的建筑方针。结合严寒气候区的气候特点和木材资源特点,因地制宜的研究开发满足绿色节能、经济性好的轻型木结构建筑,是实现现代轻型木结构建筑持续发展的有效途径。从相当于提高冬季室外空气温度、减少柱体传热温差的角度开展研究,将木结构建筑与内嵌管式技术相结合,在轻型木结构建筑中埋入盘管
学位
建筑设计冷负荷是指导空调系统设计的重要依据,决定了设备容量大小、管网系统规模以及工程初投资和运行成本,正确地计算设计冷负荷对整个系统合理设计具有重要意义。传统设计方法忽略了参数不确定性的影响,依据此设计负荷会使制冷设备尺寸过大。目前,关于设计阶段参数的不确定性量化已有大量研究,然而对于内扰设计参数的设置,缺乏针对性的调研和细致的描述,尤其是建筑中不确定的人行为究竟如何影响人员数量、设备功率密度和照
学位
太阳能一直被认为是最有潜力的可再生能源,但是太阳能电池存在工作温度升高导致其发电效率下降的弊端。在现有的太阳能电池降温技术中,主动冷却技术需要一定的能量输入从而降低了经济性,被动冷却技术会增加原有系统的复杂性和加工难度,增大其成本。而刚刚兴起的辐射冷却技术以低温的外太空作为冷源,以8-13μm的“大气窗口”为通道,将地表物体的热量以热辐射形式排出。这种技术不仅不需要消耗能量,而且可以全天候进行冷却
学位
辐射式空调系统因相比于对流式空调具有更高的热舒适性而被广泛使用,尤其是在运行状态较为稳定的办公建筑中应用较多。但辐射式空调系统时滞性大,末端与室内传热的延迟时间长,传统的系统调控方法没有充分利用系统的延迟效应,对负荷的动态变化实施有效的动态调控,导致系统供能与建筑实际负荷需求在时间序列上不匹配,室内热环境控制的稳定性较低,并造成较高的能源浪费。因此,充分考虑辐射式空调系统的延迟效应及动态的负荷需求
学位
地铁车站站台属于典型的地下狭长空间,其烟气流动规律不同于常规空间。地铁站台火灾具有火势蔓延速度快、火源燃烧不完全、人员疏散困难等特点。在地铁站台的火灾中,由于可燃物燃烧不完全,释放出来的烟气中会含有有毒气体,高温和有毒的烟气会威胁疏散人员的生命安全。经统计在火灾中,大约86%的遇难者是死于吸入烟气,而不是火灾本身。因此,在地铁站台发生火灾时,采取适当的措施来控制火灾烟气的蔓延,对生命安全具有重要意
学位
研究目的:观察不同类型贴扎(肌内效贴和白贴)对离心运动诱发的膝关节肌肉疲劳后的等速肌力、本体感觉和姿势控制的即刻影响。研究方法:共招募男性健康大学生受试者30人,选择右侧优势腿进行实验。对每位受试者随机开展4组干预,分别在正常、疲劳、白贴贴扎以及肌内效贴贴扎四种情况下进行测试,组间测试需经历7日的洗脱期。贴扎的肌肉为股四头肌和腘绳肌。除正常组外,其余三个组均要接受疲劳方案。其中,正常组直接进行测试
学位
学位
飞机作为时下最便捷的交通工具,选择乘机出行的人越来越多,人们也更加重视客舱空气品质的安全问题。为保证客机机组人员及乘客的健康舒适,飞机环境控制系统必须安装航空过滤器,用于去除机舱环境中的污染物。本研究主要是为能掌握航空HEPA过滤器自主知识产权,并为打破国外大公司对庞大市场的垄断做出了努力。本研究通过调研总结了国内外高效过滤器测试标准,在过滤器的过滤效率、阻力和容尘量的测试方法中确定出了适合航空过
学位
我国目前的废轮胎年产量已超过1000万吨,居世界首位,但废轮胎的平均回收利用率却不到40%,远远低于其他发达国家。利用热解技术处理废轮胎不仅具有较高的回收利用率,实现废轮胎的循环利用,同时也是一种清洁高效、环境友好的处理技术,因而受到了国内外学者的广泛关注。因制造工艺上的特点,废轮胎中含有相对较多的氮、硫、氯等有害元素,在热解过程中会转化为各种含氮、硫、氯的有害污染物,因而研究废轮胎热解过程中氮、
学位
<正>氢能是一种清洁高效、来源丰富的二次能源,在车载、船用、固定式发电等多场景下均有广阔的应用前景。这些场景中利用氢能的核心设备为氢燃料电池(PEMFC)。本文分析了PEMFC的工况特点及其对冷却液性能的要求,介绍了长城HFC氢燃料电池冷却液性能、技术指标和应用情况,给出了氢燃料电池冷却液的“中国石化方案”。
期刊