【摘 要】
:
问题生成任务是指在给定一个段落和指定答案的情况下,逆向生成多角度的问题。问题生成任务具有广泛的应用性,已经成为自然语言处理领域内的研究热点之一。但是,传统的问题生成模型中存在很多问题。一方面,模型对长文本语义信息提取不足,无法获取丰富的信息特征;另一方面,模型在文本和答案的交互上欠缺,造成生成问题的语义偏离于文本和答案。针对以上问题,本文在基于LSTM的问题生成模型上进行改进。该模型的编码器和解码
论文部分内容阅读
问题生成任务是指在给定一个段落和指定答案的情况下,逆向生成多角度的问题。问题生成任务具有广泛的应用性,已经成为自然语言处理领域内的研究热点之一。但是,传统的问题生成模型中存在很多问题。一方面,模型对长文本语义信息提取不足,无法获取丰富的信息特征;另一方面,模型在文本和答案的交互上欠缺,造成生成问题的语义偏离于文本和答案。针对以上问题,本文在基于LSTM的问题生成模型上进行改进。该模型的编码器和解码器均为LSTM模型,并且模型利用基于最大输出的复制机制和指针生成网络避免输入序列重复而造成输出序列复制重复词语的情况。基于以上模型架构,本文提出了一种融合丰富语言特征和双向注意力层的问题生成模型。模型通过扩充输入文本嵌入层信息,抽取深层次语义特征;另外,利用双向注意力层融合文本和答案信息。本文研究的主要内容分为以下两方面:(1)提出了一种基于丰富语言特征的词向量表示方法。即在嵌入层中通过融入义原外部知识的方法来捕捉比词向量更小粒度的语义知识,进而增强文本自身的语义表示,解决对长文本语义提取不足的问题。另外,通过余弦相似度算法得到推荐后的义原集合,补充了词表中无对应义原单词造成的“词义遗漏”问题,也解决了在义原集合中无关义原带来的“词义杂糅”问题。在嵌入层的文本端还通过加入答案位置信息使得模型得到以答案为导向的文本表示。(2)提出了一种基于变体双向注意力层的问题生成方法。即在文本和答案分别编码后,通过双向注意力层网络,得到答案感知的上下文表征向量。另外,该模型将文本端首先加入自注意力机制,捕捉长序列文本数据内部的语义相关性,获取文本中的重点信息,之后再与答案融合。该模型所提出的变体双向注意力层机制能够聚合答案信息并且有效避免模型在早期加权时造成的信息丢失问题。最后,通过大量的实验表明,本模型在SQu AD1.1数据集上的表现优于基线模型,并且可以生成更符合人类语言习惯的更高质量的问题。
其他文献
在线新闻服务平台如今日头条、微软新闻等已成为广大用户获取新闻信息的主要来源。网上每天生成和发布了海量的新闻文章,导致用户很难快速找到感兴趣的新闻。然而个性化新闻推荐可以帮助用户缓解信息过载,提升新闻阅读体验,因此在众多网络新闻平台中得到广泛应用。新闻推荐中两个关键点分别为新闻文章表示和用户兴趣建模。对于新闻文本的表示,本文采用改进过的transformer模型并融合新闻类别信息去学习得到新闻文章表
推荐系统和聚类是两种应用广泛的数据挖掘技术。推荐系统可以帮助用户高效、有效地获取有用的在线资源,聚类技术能够降低数据的高维度和稀疏度,尽可能地将相似的对象聚类在一起,将不同的对象分开。近年来,在进行推荐之前,将具有相似特征的用户或者项目进行分组已经成为一种趋势,以此提高推荐质量。本文分别从优化常见聚类的缺点和消除聚类的关键性参数角度提出了聚类与推荐算法结合的思路,即基于聚类和模拟退火的协同过滤算法
氧化铝高温溶出工序是氧化铝生产中重要的组成环节,具有多种因素相互作用的特点,其中溶出温度是影响溶出质量最重要的工艺指标,仅依赖生产人员难以对溶出温度做到精准决策控制。通过对氧化铝企业溶出环节实际工艺流程的研究和对大量的历史数据进行分析,本文采用深度强化学习算法对氧化铝溶出环节的溶出温度进行决策,从而提高溶出质量。(1)对企业提供的溶出环节相关原始生产数据进行缺失值、异常值处理和可视化分析,并使用X
深度神经网络(DNN)可以有效地从海量复杂数据中提取重要的信息,已被广泛应用于图像识别、语音识别及自然语言处理等领域。但这些神经网络使用时会带来较大的计算和内存开销,限制了在资源有限场景下的使用。传统的CPU与GPU处理器,由于其硬件架构中计算与内存单元的容量限制,无法满足很多应用场景对DNN算法的高性能与低能耗的要求。因此,研究者们提出在现场可编程逻辑门阵列(FPGA)上设计适应神经网络算法的硬
有限混合模型由于其对数据的强大拟合能力,成为统计机器学习中重要的数据建模工具,在模式识别、计算机视觉以及数据挖掘等领域都有着众多的应用前景,近些年来得到了研究者们的广泛关注。然而,传统的有限混合模型主要是用高斯分布构建的,对于现实生活中产生的一些特殊数据,例如文本,图像等有界数据,以及一些其他领域的非对称数据等不能很好地进行描述。因此急需使用一些由非高斯分布构建的有限混合模型解决上述问题。在这些非
高精度器件表面数字化对于检测、装配具有重要作用。采集到的点云数据根据器件精度容量增加很快,快速处理海量数据成为解决实时性的热点。点云数据三维重建精度、速度指标都是虚拟装配中需要重点考虑的,这些指标和系统搭建、点云重建都存在密切关系。本文从三维重建算法、点云模型参数检测以及3D系统设计三个方面对工业球形零件和海量数据进行三维重建与关键参数计算进行了深入研究,实现了海量数据的快速重构和模型表面的三维参
我国是全球预焙阳极重要的生产基地,煅后焦粉末电阻率的高低在一定程度上影响着预焙阳极质量的好坏。研究煅后焦粉末电阻率的影响因素,并使用机器学习算法预测电阻率的大小,方便工艺人员及时调整生产控制参数,对提高阳极质量具有重要的意义。本文首先依据阳极生产工艺原理,对阳极煅后焦生产历史数据进行了预处理和可视化分析。其次,寻找影响煅后焦粉末电阻率的物料参数和控制参数,探索了利用XGBoost通过将预测值取反的
随着万物互联时代的到来,越来越多的工作流中含有大量的IoT数据实时处理任务,如智慧城市、智能交通等应用场景中的工作流应用。为了提高工作流的执行效率、充分利用计算资源,采用云、边协同方式进行工作流调度执行成为必然。然而IoT数据参与的工作流在云边环境的调度执行会面临诸多挑战。例如IoT数据多为连续、时效性强的流数据,因此IoT数据处理的工作流需要不断地重复执行;同时,IoT数据的动态性也会影响到工作
高效用项集挖掘是数据挖掘领域中研究热点之一,它旨在发现事务数据库中具有高度重要性的模式。近年来,学者们提出了大量相关方面的算法,并取得了一定的研究成果。然而,目前大多数高效用项集挖掘算法仅仅关注项集的效用值,导致挖掘出的项集大多数是弱相关的,在实际生活中没有意义。首先,本文针对上述问题提出了ULB-CHMiner算法来发现相关性更强的高效用项集。该算法在ULB-Miner算法的基础上引入了全置信度
近年来,随着城市化进程不断加快,频繁的人口流动导致大规模的人群聚集现场出现的频率大幅提升,在地铁站、购物商场、旅游景点或者其他大型活动的广场等地出现的概率较高。2014年底,上海外滩跨年活动中发生的踩踏事件,再一次警醒管理部门提高对密集场所的预警关注与监管。为此基于现代智能化技术人群计数任务得到了广泛的研究,通过智能监控分析进行人群计数,为公共安全保障、提供交通调度以及商业布局奠定技术基础。随着深