基于注意力机制的文本作者识别

来源 :计算机应用 | 被引量 : 1次 | 上传用户:liantonglingsheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于神经网络的作者识别在面临较多候选作者时识别准确率会大幅降低。为了提高作者识别精度,提出一种由快速文本分类(fastText)和注意力层构成的神经网络,并将该网络结合连续的词性标签n元组合(POS n-gram)特征进行中文小说的作者识别。与文本卷积神经网络(TextCNN)、文本循环神经网络(TextRNN)、长短期记忆(LSTM)网络和fastText进行对比,实验结果表明,所提出的模型获得了最高的分类准确率,与fastText模型相比,注意力机制的引入使得不同POS n-gram特征对应的准
其他文献
轮胎生产过程中出现的胎侧异物、胎冠异物、气泡、胎冠开根以及胎侧开根等缺陷会影响轮胎出厂后的使用,所以出厂使用前需要对每条轮胎进行无损检测。为了实现在工业中对于轮胎缺陷进行自动检测,提出了一种基于改进Faster R-CNN的轮胎缺陷自动检测方法。首先,在预处理阶段,用直方图均衡化方法对轮胎图象的灰度进行拉伸,提高数据集的对比度,使图像目标和背景的灰度值产生明显差异;其次,为提高轮胎缺陷位置检测和识
针对约束多目标优化算法存在难以有效地兼顾收敛性和多样性的问题,提出一种基于协同进化的约束多目标优化算法。第一阶段,通过基于稳态演化的可行解搜索方式得到一个具有一定数量可行解的种群;第二阶段,将这个种群拆分为两个子种群,并通过双子种群协同进化的方式实现对收敛性和多样性的兼顾;最后采用标准约束多目标优化问题CF1~CF7、DOC1~DOC7和实际工程问题进行仿真实验,以测试所提算法的求解性能。实验结果
针对传统视频摘要方法往往没有考虑时序信息以及提取的视频特征过于复杂、易出现过拟合现象的问题,提出一种基于改进的双向长短期记忆(BiLSTM)网络的视频摘要生成模型。首先,通过卷积神经网络(CNN)提取视频帧的深度特征,而且为了使生成的视频摘要更具多样性,采用BiLSTM网络将深度特征识别任务转换为视频帧的时序特征标注任务,让模型获得更多上下文信息;其次,考虑到生成的视频摘要应当具有代表性,因此通过
针对现有的生成对抗网络(GAN)伪造人脸图像检测方法在有角度及遮挡情况下存在的真实人脸误判问题,提出了一种基于深度对齐网络(DAN)的GAN伪造人脸图像检测方法。首先,基于DAN设计面部关键点提取网络,以提取真伪人脸关键点位置;然后,采用主成分分析(PCA)方法将每一组关键点映射到三维空间,从而减少冗余信息以及降低特征维度;最后,利用支持向量机(SVM)五折交叉验证对特征进行分类,并计算准确率。实
近日,SAP一年一度的全球蓝宝石大会(SAPPHIRENOW)正式召开。如之前所料,RISE with SAP 成为本次大会的重磅话题之一,只不过这次发布的重点是行业细分解决方案。另外,SAP 中国峰会同期举行,SAP 全球执行副总裁、大中华区总裁纪秉盟,从战略定位、组织架构调整、市场、产品和生态等层面,全面介绍了大中华区市场策略。战略定位:成为最具合作精神的企业云在 SAP 看来,云正在加速全球
针对大数据环境下分类精度不高的问题,提出了一种面向分布式数据流的集成分类模型。首先,使用微簇模式减少局部节点向中心节点传输的数据量,降低通信代价;然后,使用样本重构算法生成全局分类器的训练样本;最后,提出一种面向漂移数据流的集成分类模型,采用动态分类器和稳定分类器的加权组合策略,使用混合标记策略标记最具代表性的样本以更新集成模型。在两个虚拟数据集和两个真实数据集上的实验结果表明,该模型与DS-me
针对单一社交网络平台中推荐相似用户结果单一,对用户兴趣和行为信息了解不够全面的问题,提出了基于知识图谱和重启随机游走的跨平台用户推荐方法(URCP-KR)。首先,在分割、匹配出的目标平台图谱和辅助平台图谱的相似子图中,利用改进的多层循环神经网络(RNN)预测出候选用户实体,再综合利用拓扑结构特征相似度和用户画像相似度筛选出相似用户;然后,将辅助平台图谱中的相似用户的关系信息补全到目标平台图谱;最后
针对多中继协作空间调制(SM)系统中的中继选择问题,提出一种基于中继节点位置的选择方案,并将该方案应用于系统中,对系统的误比特率(BER)性能进行了分析。该系统在源节点使用SM技术,每一时隙仅激活一根发射天线,并基于中继节点的位置信息,在全部中继中选择最接近源节点和目的节点间中点的一个放大转发(AF)中继进行转发。运用矩生成函数法推导了该系统在瑞利衰落信道下成对错误概率的解,并由此给出了系统的理论
针对基于双向长短期记忆网络-条件随机场(BiLSTM-CRF)的事件抽取模型仅能获取字粒度语义信息,可学习特征维度较低致使模型上限低的问题,以开放领域的中文公共突发事件数据为研究对象,提出了一种基于命名实体识别任务反馈增强的中文突发事件抽取方法 FB-Latiice-BiLSTM-CRF。首先,将Lattice(点阵)机制融合双向长短期记忆(BiLSTM)网络作为模型的共享层,获取句子中的词语语义
针对纹理图像在平滑过程中低对比度边缘易丢失和纹理细节抑制不彻底等问题,提出基于梯度曲面面积与稀疏约束的图像平滑方法。首先,将图像视作三维空间中的二维嵌入曲面,再在此基础上分析图像的几何特征并提出梯度曲面面积约束正则化项,以提高纹理抑制性能;其次,根据图像的统计特性,建立L_0梯度稀疏与自适应梯度曲面面积约束的混合正则化约束图像平滑模型;最后,采用交替方向乘子法对非凸非光滑的优化模型进行高效求解。通