面向受限域的通用自动问答系统的设计与实现

来源 :北京邮电大学 | 被引量 : 6次 | 上传用户:kxf2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及和快速发展,网上的信息量成爆炸式增长,如何在巨大的信息量中快速准确地搜索出我们需要的信息成为一个急需解决的问题。传统的搜索引擎返回的信息太过繁琐,已无法很好的满足用户需求。自动问答系统在传统搜索引擎的基础上融入了自然语言处理的知识,返回的答案更加精确、快速,能够更好的满足用户的检索需求。自动问答系统可以分为面向受限域的自动问答系统和面向开放域的自动问答系统。受限域问答系统只处理一个特定领域的问题,限制用户提出问题的范围,开放域问答系统则没有此限制,可以处理任何领域的问题,用户可以随意提问。但是,由于自然语言的复杂性,面向开放域的自动问答系统到目前为止性能不是很好,因而本文的系统是面向受限域的。另一方面,传统的面向受限域的自动问答系统选定领域后就无法更改,可重用性差,本文设计并实现了一个领域更换的方案,使得本文的系统可以更换领域,具备通用性。为提高自动问答系统中语句相似度计算的准确率,本文提出了一种新的基于向量空间模型的TextRank-RD算法。该算法根据词语是否在领域词典中、词语是否为名词、词位置三个因素来为节点进行初始赋值,采用按节点重要性分配权值的图模型而不是节点影响力均分的图模型。实验结果表明,该算法与基于向量空间模型的TF-IDF算法相比,提高了语句相似度计算的准确率,对提升自动问答系统效率具有重要意义。本文结合领域词典来提高分词效果,提出了一种新的语句相似度的计算方法,设计了一套Web信息抽取机制以及FAQ知识库更新机制,使得系统在面向受限域时能取得较好的效果并能随着时间推进而改进,同时通过管理员导入领域词典以及初始FAQ库的方式使得系统可以更换领域,具备通用性。
其他文献
学前儿童舞蹈教学,既包含着教育方法的普遍性,又具有其特殊性。笔者根据多年的学前儿童舞蹈教学工作经验,结合心理学相关知识,对于如何更快、更好的展开学前儿童(3—6岁)舞蹈
非点源污染由于具有来源途径多、污染严重、难以实时监测和治理等特点,成为当今世界上难以治理的主要课题之一,在全球范围内引起广泛的关注。农业非点源污染(Agricultural Non-p
目的:探讨中西医结合治疗周围性面瘫的疗效。方法:将我院72例周围性面瘫患者随机分成两组。其中一组为治疗组(36例),治疗组患者采用中西医结合疗法进行治疗,另一组为对照组(3
现行的地方税制与按照分税制原则建立的地方税体系还有一定差距,主要表现为地方税权、事权、财权不统一,地方税收入规模偏小,主体税种不明确,内外税制不统一,税种划分不够规
  从Mg(OH)2-SO2-H2O系统工业应用谈起,介绍了镁法脱硫的现状及近期研究进展,对镁法烟气脱硫的不同工艺---再生法、硫酸镁回收法、亚硫酸镁回收法、抛弃法与双碱法分别进行评
长期以来,职业教育始终面临发展活力不足、与市场需求差距甚大的局面。这主要是因为职业教育在发展过程中人才培养过程与生产过程相脱离。职业教育中人才的培养可以由市场决
目的:研究骨碎补总黄酮治疗绝经后女性骨质疏松症的临床疗效。方法:选取符合纳入标准的绝经后女性骨质疏松症患者68例,按就诊顺序将其随机分成治疗组35例,对照组33例,治疗组
通过运用不同的多水平模型技术,量化分析中国东西部三个地级市2009—2012年高考考生的高考和中考成绩、学校和教师问卷信息,同时质性分析核心利益相关者访谈质性数据,以探究
心力衰竭是一个全球性问题,目前全世界有3 800万患者,且随着人口老龄化,这个数字会逐渐增加。基因治疗是将目的基因导入靶细胞,转移并表达特异的基因,从而改善失去正常功能的
摘要:重载铁路以其轴重大、运能高、运输成本低等特点,已经成为铁路运输发展的一个重要方向。列车轴重的增加必然会使轨下基础承受更大的振动荷载,对重载铁路隧底结构安全性造