结合多头注意力机制的旅游问句分类研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:jojochen812
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
旅游问句具有长度较短,不严格按照语法规则的特点,导致该文本数据信息容量过少、口语化严重.充分理解问句表达的语义是提高旅游问句分类器性能面临的重要挑战,基于此,提出一个融合Bi-GRU、CNN与Multi-Head-Attention的旅游问句分类模型.该模型将预先训练的词向量和经Bi-GRU处理得到的语义信息进行融合,进行问句依赖关系学习,通过CNN和Multi-Head-Attention进行特征提取,以加强局部特征的学习,通过Softmax完成分类.实验结果表明,该模型在文本信息少、表述不规范的旅游问句分类任务中F1值达到了92.11%,优于现有的主流分类模型.
其他文献
针对于传统方法中存在的文本特征表示能力差、模型主题识别准确率低等问题,提出一种融合SENet与卷积神经网络的文本主题识别方法.将每个词对应的Word2vec词向量与LDA主题向量进行融合,并依据词语对主题的贡献度完成文档加权向量化处理;构建SECNN主题识别模型,使用SENet对卷积层输出的特征图进行权值的重标定,依靠其提升重要特征并抑制无用特征的性能,高效地进行主题识别;使用FDA评估样本的类别表征能力,提出FDA-SGD算法对模型参数进行调优,完成文本主题识别任务.使用新闻文本数据集验证改进算法的有效
区块链是基于数字加密货币基础上发展而来的分布式数据库技术,区块链系统具有去中心化、不可篡改、高度自治、分布共识等特点,为无需第三方监管实现分布式一致性问题提供了解决方案.随着区块链技术快速发展,区块链在弱信任平台应用领域更加普及,但也面临着自身系统漏洞和安全攻击的挑战.从区块链研究背景及漏洞发展趋势入手,总结分析了区块链关键技术原理及其优缺点、区块链系统存在的技术漏洞和安全攻击,并对技术漏洞和漏洞攻击类型进行归纳分类,指出语法错误、环境配置和图形界面错误是区块链系统中排前三的漏洞缺陷,漏洞攻击对区块链系统
针对麻雀搜索算法(SSA)在寻优后期出现能力不足、种群多样性损失、易落进局部极值现象,造成SSA算法收敛速度慢、探索能力不足等问题,提出了融合正余弦和柯西变异的麻雀搜索算法(SCSSA).借助折射反向学习机制初始化种群,增加物种多样性;在发现者位置更新中引入正余弦策略以及非线性递减搜索因子和权重因子协调算法的全局和局部寻优能力;在跟随者位置中引入柯西变异对最优解进行扰动更新,提高算法获取全局最优解能力.通过10个经典测试函数对SCSSA算法在收敛速度、收敛精度、平均绝对误差等指标的评估,并引进工程设计优化
针对于数据中心网络不均衡的流量分布,和在使用固定功能交换机的软件定义网络中部署强化学习模型时,不能精确感知网络状态导致的路由决策偏差问题,设计了一种在具有可编程数据平面的软件定义网络中,基于深度确定性策略梯度(DDPG)强化学习模型的路由优化方法.通过在可编程数据平面自定义数据包处理逻辑,获取细粒度、高精度的网络状态参数,然后在控制平面使用DDPG模型根据网络状态参数确定多条可选路径的链路权值,并为数据流选择具有最大综合剩余负载能力的路由路径,最后以源路由的方式下发流表.实验结果表明,该方法可以在较高的带
时序图是一种边上带有时间戳的图结构,其中边上的时间戳表示该边出现时间,即图随时间变化不断变化.图数据中的稠密子图挖掘问题具有非常强烈的现实意义.目前,时序图中大多数现有的工作都集中在稠密子图检测问题,该问题目标是找到时序图中所有的目标子图.然而,当时序图的规模过大时,这一问题将变得极其复杂且收效甚微.旨在研究在时序图中长期被忽视的稠密子图搜索问题.具体来讲,给定一个图中的查询顶点,目标是找到一个在一段时间内持续存在且包含该查询点的稠密子图,即该子图满足时间持续性.从全局削减和局部扩展两种不同的思路出发,设
针对数据中心网络异常流量检测难的问题,提出一种自适应阈值的大象流检测系统.系统结合数据中心网络高度灵活性和全局可见性的特点,采用基于高斯分布的加权优化动态流量学习方法实时预测大象流检测阈值,降低检测错误率,通过基于差分估计的平滑机制,降低检测阈值配置更新频率.仿真实验结果表明,该系统可以有效识别数据中心网络中的大小流,识别错误率较低,通过平滑机制处理减少了流表抖动,控制平面的开销和检测时延相对较低,实现了数据中心网络流量的实时有效监控.
针对约束优化问题,提出一种复合人工蜂群算法.该算法引入多维随机变异操作和最优引导变异操作平衡算法的探索能力和开发能力.将ε约束和可行性规则相结合平衡目标函数与约束,加快算法的收敛.通过对CEC 2006中20个测试函数和CEC 2010中18个测试函数及3个实际工程优化问题的实验结果分析表明,该算法对约束优化问题可行有效.
服务类网站的用户评价是消费者选择的重要参考,受商业利益的驱使,点评网站上充斥着大量不符合产品真实特性的评论,虚假评论的检测与治理,对于监督网站运营,净化网络环境具有重要的意义.为了提升虚假评论的检测结果,在基于词和文档构建的图神经网络进行文本分类的基础上,提出基于融合语义相似度的图卷积网络(sematic-graph convolution networks)的虚假评论检测方法.基于PMI(pointwise mutual information)指数以及基于词嵌入度量的语义相似度构建词与词之间的连边,基
作为“智慧法院”的核心应用之一,相似裁判文书的发现有助于解决司法过程中裁判尺度不统一、类案不同、量刑不规范等问题.目前,一部分方法侧重于从裁判文书中总结领域特征,并将这些特征融入到语言模型中来提升相似文书发现的效果.另一部分工作将其转化为分类任务,利用有监督学习模型来进行建模与预测.然而,已有的方法没有考虑将语言模型与分类模型各自的优势进行结合.为此,提出一种基于网络表示学习(network representation learning)和文本卷积网络(convolutional neural netw
针对实用拜占庭容错算法(PBFT)中存在的通信开销大、算法效率低等问题,结合联盟链特点,提出了一种改进的PBFT算法(score-PBFT,S-PBFT).引入节点评分机制,将节点划分为共识节点、候选节点和预备节点三种类型,并根据节点行为对节点进行动态调整,最大程度上保证共识节点的可靠性.改进了主节点的选举方式,以节点初始积分及其行为作为选举依据,来提高算法稳定性.优化一致性协议执行流程,减少共识过程参与节点数,降低算法复杂度,提高算法的效率.结果表明,相较于PBFT算法,S-PBFT算法在共识时延、通信