基于文本识别技术的电气设备监测数据处理

来源 :华北电力大学 | 被引量 : 0次 | 上传用户:slow1223rabbit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的不断进步,对电气设备的工作要求越来越高。电力系统作为当今能源产业的重要组成部分,在生产过程中产生了海量的故障文本数据。如何有效处理电力系统中积累的大量中文文本故障数据,对电气设备监测数据领域的研究具有重要意义。目前,电力系统故障文本大多使用单一模型进行分类,且精确度有待进一步提高。针对这一情况,构建多种文本分类模型并比较分析,有利于提高电力设备故障文本分类的准确性。电力设备故障文本在分类之前需要专业人士进行人工筛选,传统的机器学习模型需要对筛选后的数据做特征提取、空间向量表示和模型训练等工作,深度学习模型进行人工标注处理文本序列,直接将筛选后的文本投放到分类器中训练。本文针对机器学习分类模型和深度学习分类模型对文本分类准确率高低为出发点,构建了多种分类模型比较分析,得出分类准确率较高的模型。针对电气设备故障文本分类研究,构建了五种传统的机器学习分类模型(支持向量机模型、K-最近邻模型、朴素贝叶斯模型、Logistic回归模型、Gradient Boosting模型),研究这些模型的故障数据分类准确率。研究过程包括对筛选后的故障数据通过隐马尔科夫模型的维特比算法进行文本分词和去除停用词处理,接着对预处理后的数据通过卡方统计量和互信息法以及融合卡方统计量和互信息法改进的M-CHI法对文本数据进行特征提取,并通过空间向量模型进行文本表示得到词向量矩阵,接下来将词向量矩阵分别投放到构建的五种机器学习训练模型中。实验结果表明,改进的M-CHI特征提取方法提高了故障数据的特征提取值,支持向量机模型在采用该方法的基础上是五种机器学习模型中分类准确率最高的。针对深度学习对文本分类研究,在LSTM模型基础上,为了加强故障文本上下文信息关联,改善信息不连续导致分类错误的情况,构建了双层双向LSTM模型,接着采用Word2vec词向量模型的Skip-Gram架构对词向量进行训练,并融合深层注意力机制关注文本数据中不同词向量的权重,构建了基于深层注意力机制的DA-BiLSTM模型,并与机器学习模型进行分类效果对比分析。实验结果表明,通过对该模型性能做综合训练测试,验证了该模型的分类准确率优于机器学习分类模型,为电气设备监测数据分类提供了有价值的参考。
其他文献
在“宽专业、厚基础、强能力、高素质”的人才培养目标的思想指导下,我校在实施实验室项目中,以人才培养目标为指导,用过程管理把关实验室项目建设、软硬件建设,有效地提高了实验
针对伊朗德黑兰北部高速公路项目六号桥的群桩基础中1根未能进入基岩的情况,采用桩底后压浆技术桩进行了加固处理。这样的桩基加固处理不仅满足设计要求,也取得了经济效益,可为
随着科学技术的趋同性,消费者对于商品不再只是对其具备的功能有需求,更多的关注点在于产品的外观形态和品牌形象上。建立一个完整的产品族能够帮助企业树立品牌形象,进而提升企业的市场竞争力。目前,一些国际知名大品牌已经建立了自己的产品族,尤其是汽车行业,然而却很少有学者将该设计方法运用到产品包装设计当中。另外,传统的产品族设计主要依靠计算机编程来实现基因的重组,这非常不利于该设计方法的推广,因此,就目前的
近30年来,中国的历史学研究同其他人文学科一样,取得了长足的进步,在方法、理论和研究手段等方面都展示出了前所未有的新面貌,同时也开辟了许多新的研究领域。
以乙二胺四乙酸二钠(ethylenediamjn tetraacetic acid disodium,EDTA)为鳌合剂,在水溶液络合体系中采用电沉积法制备了CuSCN半导体薄膜,应用电子隧穿成核和表面态热激发机理以
本研究基于认知语义学意义观,运用构式压制、概念转喻等理论来探剖析“副名结构”.解构了“副名结构”中名词的功能,从传统上指称实体转化为描述事物性状,功能发生游移.阐述
以SnCl4·5H2O,Zn(NO3)2·6H2O和NaOH为原料,用低温固相反应法合成尖晶石型复合氧化物Zn2SnO4纳米晶体。用X射线衍射、透射电镜表征粉末的晶体结构和形态。结果表明:固相
新疆乌鲁木齐地区是多民族聚居的城市,近几年来脂肪肝和胆囊结石的发病率呈明显上升趋势,尤其在少数民族中更为突出。本文旨在探讨两病在汉族、少数民族中患病率关系并作对比研
在地热资源的勘察过程中,物勘测井是极其重要的组成部分。以计算机为核心的数字测井技术的发展实现了高精度测井数据采集和测井资料的计算机自动解释与分析,极大地提高了测井解决地质问题的能力。测井解释软件是对测井数据处理,使测井成果可以用计算机以表格打印、图形输出等直观形式显示出来。本文所研究的测井仪器是上世纪70年代由PRUETT公司引进的TPS-9000型高温测试仪,其具有高精度、高分辨率的特点,能瞬时
“供给侧结构性改革”是2015年11月10日习近平总书记首次提出的,即全面提高供给质量,改革和促进结构调整,扩大有效供给,促进经济社会的可持续发展。在国民经济不断发展的今天,大众对体育活动的参与度与日俱增,高效利用现有体育场馆是必不可少的,且日益完善的大学城新区是山西省高校的聚集地,大学城相对充足的体育场馆在省内有很大的示范作用。但是目前大学城高校体育场馆在学校基本教学和课后训练之余存在闲置状态,