【摘 要】
:
随着网络生活的极大丰富,互联网上充斥着海量的文本信息。如何利用人工智能的相关技术对互联网中存在的海量文本进行分析和利用已经成为人工智能领域一个重要的研究方向。由
论文部分内容阅读
随着网络生活的极大丰富,互联网上充斥着海量的文本信息。如何利用人工智能的相关技术对互联网中存在的海量文本进行分析和利用已经成为人工智能领域一个重要的研究方向。由于文本可以看作是由一系列单词构成,想要利用人工智能相关技术对文本进行处理,首先需要将单词符号表示为计算机可以计算的向量表示。传统的基于神经网络的单词向量表示方法只能将每一个单词表示为一个唯一确定的向量。但是在自然语言中广泛存在着一词多义的现象,而同一个向量难以表示不同的语义含义。上下文相关的单词向量表示会随着单词所在的上下文的变化而变化,从而很好的解决了这一问题。但是现有的上下文相关单词向量表示方法都是需要预训练的,这类方法存在一些不足,比如预训练所需的数据集通常很难获得,难以处理脱敏数据等。本文提出了一种无需预训练的上下文相关单词向量表示方法,并且可以嵌入到任何端到端的网络模型中去。该方法利用多通道的时序卷积网络提取单词的上下文特征并利用高速神经网络将单词的向量表示与上下文相关特征进行特征融合,最终得到上下文相关单词向量表示。该方法即有效的避免了基于预训练的上下文相关单词向量表示的不足,同时有为单词的向量表示引入了上下文特征,使得单词在不同的上下文中具有不同的向量表示,从而很好地解决了一词多义问题。本文分别在文本分类任务以及文本意图匹配任务对下文相关单词向量表示的效果进行检验,实验证明本文提出的模型得到的上下文相关单词向量表示远好于传统的单词向量表示,可以极大的提升模型的效果。
其他文献
水稻是世界上最重要的粮食作物之一,对高产品种产量性状的解析在保证粮食安全上有重要意义。水稻产量三要素为有效穗数、每穗粒数和千粒重。内2优6号是一个高产优质的三系超
近年来,延长治疗性抗体半衰期已成为抗体工程改造的重点。抗体半衰期的延长不仅可以提高药效,减少给药频率,而且可以降低治疗费用。利用Fc基因改造以提高抗体和人新生儿Fc受
量子理论的发展衍生了基于量子概率构建语言模型的研究,有学者提出量子语言模型(QLM)并将其应用于信息检索任务中,该模型利用量子理论中的密度矩阵建模句子中的词项依赖。近
随着三维视频的发展掀起巨大热潮,三维音频也受到广泛关注。真正的三维音频系统能够重建水平方向、垂直方向和距离三个维度上的三维空间音效,使得声像能够出现在人耳感知的三
喀斯特槽谷区地表岩层裸露,地下裂隙发育丰富。该地区岩层倾角大和典型顺/逆向边坡地质构造发育充分等特征导致地表裸露岩石与坡面之间具有不同夹角,改变径流路径汇聚局部径
语文是一门非常重要的基础学科,同时也是一门能够提高学生感知认知能力和培养语言能力的综合性学科。而在小学阶段,让学生通过对经典作品的诵读可以很好地提高自身的文化素养
改革开放四十年来,中国经济崛起并迅速发展,工业化、城镇化的推进导致农村土地资源被大量开发,农民失地、失业、失房,无所依靠。为维护失地农民合法权益,我国在《宪法》、《
近年来,我国中小企业蓬勃涌现,为市场活力提升、国民经济结构优化、经济平稳健康发展提供了重要的保障作用。但是中小企业通常要面临同行业市场竞争的冲击,生存周期不长,使得中小企业向金融机构融资贷款面临诸多阻力,一定程度上制约了中小企业的经营和扩大生产。而存货质押融资业务可以有效利用中小企业的原材料和在制品等动产资源,弥补生产经营困难的中小企业的资金缺口,因而得到广泛开展。但是在业务开展过程中,受内外部市
高碱煤全国储量巨大,燃烧活性好,具有强沾污和强结渣特性,旋风液态排渣锅炉是为解决纯燃强结渣新疆高碱煤发电研发的新型高效高碱煤燃烧设备。旋风液态排渣锅炉兼备旋风炉和
目的:通过研究Wnt/β-Catenin信号通路在脑梗死后,对血管新生的影响,观察头穴围刺结合运动疗法干预脑梗死后大鼠血管新生的作用机制,为我们治疗脑梗死后脑功能重建和再生机制