融合主题信息和Transformer莫型的健康问句意图分类

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:wenjun_wu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统的一项关键任务就是如何理解用户的问句意图并将其正确地分类到相应的领域中,其分类性能直接影响着问答系统的质量.针对中文医疗健康问句数据量庞大但文本字符数少、特征稀疏的特点,以及传统卷积神经网络和循环神经网络的不足,提出了一种融合主题信息和Transformer模型的健康问句意图分类方法.首先,对短文本数据集预处理后通过BERT预训练语言模型生成词的词向量;其次,分别使用BTM主题模型和TWE模型获得文档-主题矩阵、主题-词矩阵和主题向量矩阵,由矩阵变换生成每个词的主题向量;然后,将词向量和词的主题向量拼接融合后输入到Transformer编码器中进行充分的特征提取并得到句子特征向量;最后,由全连接和Softmax分类器获得输入文本在各个类别的概率,从而实现最终的分类目的 .在中文医疗健康问句数据集上进行不同模型的对比实验,准确率、召回率和F1值指标上均有不错的提升.实验结果表明,本文提出的方法可以有效提高模型的语义表示能力和分类效果.
其他文献
提出了一种全梯度标准粒子群优化反馈(FGSPSO-BP)神经网络的工业机器人末端位姿补偿模型.首先,提出一种运动学逆变换算法,通过机器人末端位姿对机器人各关节角度值进行计算,并采用Matlab验证了运动学逆变换算法的准确性.然后,提出一种基于全梯度下降法的FGSPSO-BP算法,将机器人实际末端位姿参数作为输入样本,实际位姿与理想位姿的各关节角度值之差作为输出样本,对网络进行训练,以得到机器人实际末端位姿参数与各关节角度值差的关系,采用测试样本对网络模型算法进行了验证.最后,利用新松机器人所采集的实际位姿
为了使软体按摩机器人满足所需要的输出力要求,基于象鼻类生物结构的启发提出了一种可满足按摩输出力的软体驱动器.软体驱动器输出力主要由驱动器长度、直径和材料属性等8个内部因素及纤维线材料属性、缠绕圈数和初始编制角等4个外部因素决定.根据Hagen-Poiseuille定律分析了压强、腔室直径和驱动器长度之间的关系.通过对驱动器内部纤维线缠绕方式的讨论确定了限制其径向变形的方法.利用驱动器变形后的几何方程和力矩平衡方程建立了驱动器输出力理论模型.基于理论模型和Abaqus仿真软件生成的仿真模型进行对比分析从而确
学习风格的识别与分析有助于教学者结合学生的个性化特征改进教学策略,可以有效提高教学效率和质量,在教育技术领域具有良好的发展前景.本文针对现有学习风格识别方法精度低、实现复杂、主观性强等问题,提出了一种融合脑电特征的卷积神经网络学习风格识别模型.该模型首先利用时间、空间卷积操作,充分挖掘脑电信号的时域和空间特征;然后通过构建多尺度并行卷积结构,增强了模型的特征抽象能力;最后使用全局平均池化策略减少了模型训练参数,并实现对任意大小数据的处理.在学习风格脑电测试数据集上进行实验,结果显示该算法可达到71.2%的
联邦学习致力于在保证用户数据隐私安全的同时,通过多用户共建的方式提升机器学习模型的泛化性能.为此,在用户利用本地数据训练模型后,参数服务器需要聚合多个用户的模型参数并使用户基于聚合后参数继续本地训练.指数滑动平均是一种被广泛使用的参数聚合更新方法.然而当用户本地训练速度相差较大时,指数滑动平均方法无法消除由此造成的聚合参数偏差,从而显著影响模型整体训练效率.针对上述问题,本文提出了一种基于权重摘要和更新版本感知的异步联邦学习聚合更新方法,通过合理控制不同训练速度用户提交的参数在聚合参数中所占比例,以及主动
隐式情感分析作为自然语言处理领域的子任务,因不具备显式情感词作为情感线索,使得传统文本情感分析方法不再有效.本文旨在使用深度学习方法进行文本的隐式情感分析,根据文本隐式情感极性与句中实体、上下文语境、外部知识相关的特点,本文提出一种基于ERNIE2.0-BiLSTM-Attention (EBA)的隐式情感分析方法,能够较好捕捉隐式情感句的语义及上下文信息,有效提升隐式情感的识别能力,最后在SMP2019公开数据集上取得较好分类效果,分类模型准确率达到82.3%.
三支决策的基本思想是以“三”思考.随着理论的深入研究,2018年,姚一豫教授提出三支决策的TAO模型(Trisecting-acting-outcome),即在原有分治模型基础上,增加了新的要素-“效”,形成分(Trisecting)-治(Acting)-效(Outcome)结合的三支决策TAO模型.依托TAO模型,关注于\'治\'-\'效\'两步,研究策略施加后模型的有效性.在一类特殊的三支决策模型—基于移动的三支决策模型基础上,提出使用比例效用函数来度量三支决策的有效性,即将决策前后的
自组装是群组机器人协作中的重要研究领域,路径规划和障碍躲避是该领域的核心问题.人工势场算法(APF)及其改进在机器人路径规划中应用广泛但其在动态目标指派、迭代速度、机器人抖动等方面表现不尽如人意,因此本文提出了一种基于Voronoi约束的改进人工势场算法(VAPF),来实现群组机器人在动态目标指派策略的避障路径规划.通过匈牙利算法的目标点指派和替换策略为群组机器人提供相对最优目标指派,以群组机器人实时位置构建Voronoi图并限制机器人运动区域来保证碰撞避免,机器人个体通过人工势场算法进行自身的短程路径规
针对帝王蝶优化算法用于特征选择时需满足多目标的要求,对该算法进行了3个方面的改进:1)在个体排序步骤中引入非支配排序算法,并对调整算子做了修正,满足了多目标要求;2)增加了准确度优先策略,减少了计算资源在低准确性区域的搜索,保证了模型的准确性,满足了特征选择中准确性优先于特征数的要求;3)增加了基于子组的突变策略,对不同子组使用不同的突变策略,避免了算法过早陷入局部最优,解决了算法早熟问题.在3个定量构效特征选择基准数据集上进行了一系列实验,实验结果表明改进的算法与其它算法相比显著提高了模型的准确性并减少
本文模仿自然界生物蛇的运动,构建了一种模块可重组、强冗余性的蛇形机器人.其应用背景为不同直径的燃气、热力水平管道.目的 是在管道内以行波或螺旋的形式向前运动进行管道内壁探测.首先对蛇形机器人的机械结构和外壳进行设计;再通过MATLAB软件结合D-H分析法对其运动学进行了建模仿真,并对其控制参数进行优化,最终得到较优的空间位姿;其次为了分析蛇形机器人的运动受力情况,利用SolidWorks软件建立了样机与管道模型,之后导入ADAMS力学仿真平台进行仿真.最后进行了真实的管内运动实验.结果 证明:该蛇形机器人
代码注释有助于提高程序的可读性和可理解性,而不断地创建和更新注释非常费时费力,这将影响对软件的理解、重用和维护.自动代码注释试图解决此类问题,其中代码的表示和文本生成是研究的核心问题.该文提出一种基于编码器-解码器结构的自动生成Java代码注释模型.方法 将代码的顺序序列和代码结构作为单独的输入进行处理,允许模型学习Java方法的结构和语义;以一定的概率从模型生成的预测序列和真实词序列中采样作为下一步的输入,以提高模型的纠错恢复能力.通过与3种典型自动代码注释方法在11个Java项目上的对比实验,结果表明