诉求类短文本精准分类技术研究

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:xing123qw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社区网格化管理的发展,市民诉求数量逐渐呈现出井喷式增长趋势。对海量诉求文本进行分类,能够有效地降低市民服务热线工作人员的工作压力,提高市民服务热线的办事效率,实现政府治理和市民参与的良好互动。如何对海量的市民诉求进行有效的分类和管理,成为当下的研究热点课题之一。本文针对爬取的诉求类短文本数据集,使用基于BERT模型和基于ERNIE模型的方法进行文本分类任务。为了提取文本信息中更深层次的语义特征,本文使用BERT-Bi LSTM模型对诉求类短文本进行分类。该方法利用BERT预训练模型获取含有上下文语义信息的特征向量,输入到Bi LSTM模型中对序列进行编码和融合,获取最终的诉求类别。为了进一步提高诉求类短文本分类的准确率,本文将诉求文本中影响诉求类别的关键信息以人工标注的形式融入模型的输入表示,提出融合人工注意力机制的ERNIE-AA模型。该方法将人工注意力机制引入模型的输入向量,通过ERNIE预训练模型获取含有类别关键信息的特征向量后进行类别分类。实验结果表明,基于BERT-Bi LSTM的文本分类模型通过提取更深层次的语义特征,在分类准确率上为88.17%,相较于BERT模型和ERNIE模型分别提高1.18%和0.34%。更重要的是,本文提出的ERNIE-AA模型通过人工注意力机制获取含有关键信息的语义特征,在分类准确率上可达91.01%,较BERT-Bi LSTM模型提高2.84%。基于ERNIE-AA的诉求类短文本分类模型在分类效果上具有明显的优势。此外,经实验证明ERNIE-AA模型在修辞手法分类任务上同样具有优异的效果,ERNIE-AA模型在其他领域文本分类任务上具有泛化性。
其他文献
采用电动汽车替代燃油汽车是节能减排与治理大气污染的重要途径。电动汽车相较于燃油汽车具有尾气零排放和噪音低等优势,但面临购置成本较高、续航能力有限以及充电不便等问题。针对电动汽车购置成本高,部分电动汽车制造商开展服务化转型,在销售业务之外提供分时租赁服务。分时租赁业务旨在通过满足消费者中短途出行需求来促进电动汽车推广,但常面临着运营成本高、资产过重和盈利周期长等挑战。随着续航里程的变化和充电设施的完
学位
直流电弧炉具有电弧稳定且集中、炉内温度分布均匀、电压波动较小、电极损耗低、噪声小等优势,在钢铁冶炼领域运用广泛,但是在熔炼矿渣微晶玻璃领域尚未有工业化的报道。本文首先对单顶电极直流电弧炼钢炉进行数值模拟,然后在此基础上该炉物理模型进行改造,使其可熔炼电导率相对于废钢小的矿渣微晶玻璃原料。对电弧炉内电弧与矿渣熔化等物理特性及规律的研究有助于改进冶炼工艺,以提高产品的质量与产量。为了实现求解域中控制方
学位
卤乙酸是生活饮用水氯化消毒过程中的副产物之一,因其具有一定致癌致畸性而受到广泛关注。最新的《生活饮用水卫生标准》(GB 5749—2022)已将二氯乙酸(50 μg/L)和三氯乙酸(100 μg/L)设为水质常规指标,并将一碘乙酸(20 μg/L)设为参考指标,因此有必要更深入汇总比较各种卤乙酸标准检测方法。系统综述了中美日检测卤乙酸的各种标准方法的发展优化历程,包括气相色谱法、离子色谱法和液相色
期刊
随着人们环保意识的逐渐增强和清洁印染在纺织行业中的强烈需求,清洁的印染原材料和印染工艺越来越受到人们的关注和研究。天然染料,作为清洁印染原材料的典型代表,具有来源环保、无毒无害等特点。茜素是天然染料中红色调染料的代表性植物染料,将植物染料茜素用于纺织品染色印花具有广阔的应用前景。植物染料茜素室温条件下在水中溶解度非常低,在传统染色过程中通常需要借助金属离子作为媒染剂在高温条件下进行染色,或者借助还
学位
历史文化街区作为城市起源,反映出城市的发展历史,具有鲜明的历史特征和时代印记。随着城市快速发展的冲击,历史文化街区活力不足、居住品质降低、已经逐渐与城市发展脱节。乌素图历史文化街区初期是包头工业区的配套生活区,为保障包头市的工业发展作出了重要贡献,由于对乌素图居住性历史文化街区的更新和保护不足,街区出现传统风貌流失、居住设施老化等现象,有必要建立系统性的研究体系,激活老旧街区的生命力,延续包头市重
学位
色牢度是控制纺织品生产质量和检验纺织成品质量极为重要的指标[1]。在评定时基本沿用目测法[2],但该过程易受外界的环境及评判者主观因素的影响[3]。目前现有的解决方式是尝试采用仪器来测定实现色牢度自动评级[4],具有客观、稳定的优点,但由于取样单一、标准不一等各种客观问题,使得仪器法的评级方式未能在代替广泛目测法,测量的结果大多只作为人工评价的参考[5-7],且因为仪器操作复杂导致沾色评级时间过长
学位
当今电厂热力系统机组参数的不断提高,使电厂管道和各种重要管件处,存在由流动加速腐蚀(Flow Accelerated Corrosion,FAC)而引起的管道壁面减薄现象,严重威胁着电厂安全。因电厂热力循环系统的特殊性,发生流动加速腐蚀位置的工况多为高温、高压环境,导致对实验设备的要求极为严格,开展流动加速腐蚀实验和检测都是比较困难的。所以采用数值模拟进行FAC预测和机理分析,经过专家学者的不断验
学位
随着视觉信息获取设备成本的不断降低,图像作为视觉信息的重要载体,这导致全球互联网日均图片处理规模不断扩大。在图像生成、传输、下载过程中,易出现图像受损污染等情况,需要对缺失区域进行修复工作。在待修复图像中,建筑物图像占比较高。现有图像修复技术广泛应用到建筑设计、工业制造、影视制作等行业。图像修复的基本原理是利用已知区域的图像语义信息,经过筛选、复制、扩充等操作对缺失区域进行符合逻辑的补充,最终与原
学位
目前传统的机织物纹理分析主要依赖于人工视觉,存在主观性较强且效率低等问题。随着纺织行业逐步向智能化方向转型,将图像处理技术和机器视觉应用于分析织物纹理特征已成为研究热点。近年来字典学习被引入机织物纹理稀疏化描述中,研究表明字典学习可对纹理特征进行有效表征,但现有字典学习模型仅适用于每种类型对应单张纹理的重构,且少有研究纹理分类对字典重构结果的影响。因此基于综合模型下的稀疏表示理论,本文构建了针对较
学位
原配色化纤丝是一种由不同颜色单丝组成的化纤复丝,该纺丝工艺基于原液着色纺丝方法的切片纺丝方法,得益于超细纤维的可纺性,同时利用了三原色混色原理以及人眼视觉空间混色特性。可以使用较少的色母粒纺制不同颜色的单丝,通过调整单丝的颜色、细度以及混色比,得到类似于麻灰色的原配色丝,或者看上去颜色均一的素色原配色丝。随着全球对彩色化纤丝需求量的逐年增加,该纺丝工艺的发展前景非常可观。然而,该纺丝工艺尚处于试纺
学位