【摘 要】
:
当前,用户投诉成为供电企业关注的一项重点,如何有效地减少用户投诉,提供更好的电力服务,从而提升用户的满意度成为了供电企业努力的方向。近年来,随着供电企业管理水平的不断提高,优质服务的落地要求也越来越高。95598对电力投诉工单的分类依然采取人工分类的方法,效率低下且存在主观误差。如何快速高效地对电力投诉工单进行分类成了提高供电企业服务质量的关键。对电力投诉工单进行分类本质上是对自然语言的文本分类。
论文部分内容阅读
当前,用户投诉成为供电企业关注的一项重点,如何有效地减少用户投诉,提供更好的电力服务,从而提升用户的满意度成为了供电企业努力的方向。近年来,随着供电企业管理水平的不断提高,优质服务的落地要求也越来越高。95598对电力投诉工单的分类依然采取人工分类的方法,效率低下且存在主观误差。如何快速高效地对电力投诉工单进行分类成了提高供电企业服务质量的关键。对电力投诉工单进行分类本质上是对自然语言的文本分类。当前国内外对文本分类算法进行了许多研究,提出或改进了很多分类模型,但以上研究都存在不同的问题:是否在对数据进行预处理时考虑到单词的权重问题;是否考虑到特定的背景下进行预处理而导致产生脏数据的问题;使用传统分类方法并行分布处理能力差,学习能力弱等。本文使用一种基于词频-逆文档频度(Term Frequency-Inverse Document Frequency,TF-IDF)相似度向量的数据向量化方法。通过对语料进行建立停用词表,结巴分词、去停用词、词性过滤等步骤得到关键词,同时制作字典;接着使用Word2vec(Word to Vector)工具进行文本特征向量化;最后,对训练文档和测试文档进行文本特征向量的TF-IDF计算并进行余弦相似度计算比较,获得若干相似度。从精确率,召回率和F1得分三项指标对模型进行评价,并分别对比使用Word2vec向量,字典向量,TF-IDF向量,和TF-IDF相似度向量输入进行预处理,通过对比试验,同时使用深度玻尔兹曼机作为训练模型的情况下,本文所提出的数据预处理方法在三项指标上优于其他方法。本文提出一种基于深度玻尔兹曼机(Deep Boltzmann Machine,DBM)的电力投诉工单分类模型,对DBM采用贪心逐层预训练的方法,并将预处理获得的余弦相似度导入到DBM模型中进行训练。从精确率,召回率和F1得分三项指标对模型进行评价,使用TF-IDF相似度向量输入进行预处理,并分别对比增强学习算法AdaBoost,最邻近结点算法(K-Nearest Neighbor,KNN)分类算法和决策树三种分类模型。实验证明,本文所使用的分类模型的在三项指标上优于其它三种分类模型。
其他文献
随着市场经济的发展,企业间的竞争变得越来越激烈。对于一些中小企业来说,企业的生存和经营很大程度上依赖销售队伍的战斗力。销售人员长期处于高压力、高负荷之下,很容易出现职业倦怠;如果不及时做出调整,对其自身、企业、同事、客户都会产生很大的影响。本文以D公司销售人员为研究对象。首先,采用理论分析的方法,对职业倦怠及其相关理论进行阐述,以奠定本文的理论基础。其次,先对D公司相关领导进行访谈初步了解销售人员
随着互联网与大数据技术的蓬勃发展,云服务时代已经到来。云消息服务基于分布式消息系统,实现了在分布式组件之间自由地传递数据等功能。然而,随着业务系统向云端的迁移,消息系统的规模逐渐扩大,负载倾斜问题显现出来。服务节点之间的负载不均衡影响了云消息服务的可用性,降低了上云效果。论文针对包括Kafka、Rocket MQ和Rabbit MQ在内的多个主流分布式消息系统存在的共性负载倾斜问题,主要研究工作如
淋巴瘤是人类血液系统最常见的恶性肿瘤之一,原发于淋巴系统。临床将其分为霍奇金淋巴瘤(Hodgkin’s lymphoma,HL)和非霍奇金淋巴瘤(non-Hodgkin’s lymphoma,NHL)两类,以非
超级电容器是一种既有高功率密度且能量密度远高于电介质电容器的储能装置。按储能原理不同,可以分为双电层型超级电容器和赝电容型超级电容器。赝电容一般依靠化学吸附-脱附
中空夹层钢管混凝土是一种在传统钢管混凝土的基础上发展而来的新型组合构件。在合理设计的情况下,采用相同尺寸和材料的外钢管,中空夹层钢管混凝土的承载力一般不低于相应的
随着中国钢铁行业的发展以及“互联网+”技术的广泛运用,传统的钢铁电商行业面临的形势愈加严峻,而企业选择的价值创造路径直接决定公司的竞争优势和价值,因此企业需要积极通过价值创造路径的演化来适应行业竞争和市场需求。基于此,本文以上海钢联作为研究案例,研究上海钢联企业的价值创造路径演化过程,分析企业在演化过程中的企业价值变化,探究其价值创造路径的演化是否为企业带来价值?基于此,本文以价值创造路径研究相关
HZSM-5分子筛是一种硅铝酸盐结晶体,具有特殊的化学成分和晶体结构,因此在工业上得到了广泛的应用。随着煤化工和石油化工的发展,甲醇产量过剩,甲醇高质化发展趋势迫在眉睫。其中甲醇羰基化生成乙酸甲酯和甲酸甲酯是甲醇高质化发展的重要方向,乙酸乙酯和甲酸甲酯是合成医药、染料、香料等精细化学品的中间原料。首先探讨HZSM-5催化剂不同晶粒尺寸和孔结构对甲醇羰基化影响,使用大连理工大学提供的晶粒尺寸分别为3
随着我国低压供电系统的发展,大量的非线性装置、冲击性用电设备被接入系统,使配电系统中的三相不平衡问题越来越突出,严重影响了用户的用电质量。本文在具体工程应用背景下,采用SVG装置治理低压供电系统的三相不平衡问题,并对其中的关键技术进行了研究,主要工作和成果如下:首先针对不平衡电流检测的问题,从准确性和动态响应速度两方面对零序电流分离法和延时信号分离法展开分析,并在此基础上提出了改进,即基于双同步旋
目的:本课题以颅内动脉瘤性蛛网膜下腔出血患者为研究对象,应用血府逐瘀汤内服合首清散穴位贴敷,观察其头痛症状的改善情况、脑脊液红细胞数变化,评估血府逐瘀汤内服合首清散
本文旨在研究中英“水”隐喻的异同及其异同的原因。本文以概念隐喻理论为理论支撑,以“水”作为始源域,借助中英语料库对中英“水”隐喻进行对比研究。近年来,隐喻已成热门