【摘 要】
:
提问与回答是人们日常生活中十分常见并且非常重要的行为,随着科技和网络的日益发达,越来越多的人开始关注于如何让机器在海量的信息中自动捕获到自己需要的答案,在这种需求
论文部分内容阅读
提问与回答是人们日常生活中十分常见并且非常重要的行为,随着科技和网络的日益发达,越来越多的人开始关注于如何让机器在海量的信息中自动捕获到自己需要的答案,在这种需求的驱动下,智能问答系统应运而生,并逐渐成为自然语言处理领域的热点课题之一。每当说起问答系统,人们往往会想到另一门技术——搜索引擎。搜索引擎大多是基于关键词的搜索,无法识别出句子的语义信息,并且无法将答案直接返回给用户,因此问答系统更加符合人们的日常需求。问答系统研究的关键是让计算机可以理解人所说话的含义,即识别出句子的语义信息。而目前已有的基于词库或者规则的问答系统都无法捕获这种语义信息,因此我们可以借助于深度学习来实现。深度学习是一种结构更为复杂的神经网络,典型的深度学习有卷积神经网络和循环神经网络两种,卷积神经网络可以提取句子的特征向量,循环神经网络可以理解句子的上下文信息,它们对句子的语义理解都有很大帮助。本文实现了针对吉林大学领域的校园问答系统,该系统的总体流程为:首先构建一个针对吉林大学的校园问答库,问答库中存放着许多问题和答案对;然后当用户提出问题时,计算该问题与问答库中的所有问题的语义相似度;最后将相似度最高的问题所对应的答案返回给用户,并向用户推荐相关的问题。其中,计算句子间的语义相似度是问答系统中最为关键的步骤,本文采用了深度学习的方法对句子语义相似度对其进行了深入的研究。基于深度学习理论,本文的主要工作如下:(1)研究了2种基于深度学习的句子语义相似度算法,分别是基于卷积神经网络相似度算法和基于循环神经网络的相似度算法;(2)通过将CNN和RNN的网络模型相结合,提出了一种基于全信息特征提取的相似度算法。该算法利用一个双向循环神经网络获取词语的上下文信息,并将其作为卷积神经网络的输入提取句子的特征向量,最后计算两个句向量的夹角余弦作为相似度;(3)为了构造用于相似度模型训练的中文语料库,本文制定了一套半自主的句子相似度标注规则,利用标准的相似度评分点,划分出各种典型的语义关系区间,提高了手工标注语料库时的效率和准确度;(4)将基于全信息特征提取的句子语义相似度算法应用在问答系统中,实现了针对吉林大学领域的校园问答系统,在回答与吉林大学相关的问题方面取得了不错的效果。
其他文献
深圳是我国最先探索和实施住房保障的城市。20多年来,深圳市在扩大住房保障范围、创新保障性住房供应模式和管理制度、实现住房保障与人口、环境和产业发展相协调等方面取得
双螺旋输送机是一种很有前景的物料输送及混合机械,广泛应用于现代工业生产运输过程,一般适用于化工、建材、机械制造、煤炭、食品、医疗等行业。现今阶段国内外多以单螺杆输送机为研究对象,而双螺杆输送机与单螺杆输送机相比,由于多了一个螺杆作用,导致内部颗粒之间的碰撞冲击更加复杂,其中两螺旋叶片轴距的相互作用,对颗粒的输送特性影响较大。双螺杆输送机和单螺杆输送机两者虽然有一定的相似性,但在输送效率,受力和磨损
常言道:一图胜千言。说的是图像小而简单,但是形态万千,一个小小图像承载了大量的信息,而用文字表述较为抽象,而且生涩难懂。近年来,伴随网络技术的发展和数字多媒体技术的广
传统的光纤、卫星等传输稳定、信号质量高,在广播传输系统中发挥了巨大作用,但其传输灵活性差与系统造价高等缺点也限制了广播传输系统的发展。而随着流媒体技术的迅猛发展,
采用类岩石制备了不共面非贯通节理岩体试样,采用RMT-301岩石与混凝土力学实验系统进行模型试验,采用数值软件模拟不共面非贯通节理岩体剪切行为。对共面非贯通节理岩体的变形、强度、破坏机制以及裂纹扩展贯通形式进行了研究。主要研究成果如下:(1)基于岩石性质和相似材料选取原则,以海螺牌复合型硅酸盐水泥325R作为胶结材料,以筛分后级配连续的七眼砂作为颗粒骨料,按照质量配合比砂子:水泥:水=3:2:1制
数字图像作为一种重要的传输介质,已经成为信息时代人们获取信息的极其重要的来源方式。与此同时,随着计算机处理能力的不断提高和图像信息处理在当今信息社会中的需求越来越
引文情感分析是从极性和功能两方面分析引文,进而深入挖掘被引文献和施引文献之间的内在关联。引文是施引文献的作者对被引文献所做工作的相关描述语句。基于机器学习的情感
在移动互联网时代,移动通信和传感设备等位置感知技术的发展将人和事物的地理位置数据化,例如:内置在手机、车载导航等移动设备中的GPS,WIFI等定位设备可以直接获得移动对象
App商店的存在为App产品的开发提供了快速增长且规模巨大的数据资源,如何依据开发者需求智能化地挖掘并使用其中信息是目前的热点研究领域之一。用户评论作为App商店中一类重
移动互联网、手机APP以及社交平台的发展带来了海量图像信息,图像成为互联网信息交流的主要媒介。相比于其他海量的图像,事件图像涵盖了复杂的视觉信息和特殊的语义内容,虽然