支持自然语言提问的答疑系统的设计与实现

来源 :天津大学 | 被引量 : 0次 | 上传用户:abczxhzxh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机及Internet的发展,远程教育越来越受到人们的青睐。远程教育突破了传统教育在时间和空间上的局限,使学生在任何时间、任何地点都能够参加学习,共享优秀的教育资源。作为远程教育平台中不可缺少的组成部分,答疑系统对提高教学质量起着至关重要的作用。本文在分析了目前存在的答疑系统的不足的基础上,设计并实现了一个支持自然语言提问的智能答疑系统。从本质上讲,回答自然语言提问就是以问题为查询需求,在题库中进行检索的过程。因此,本文首先对信息检索相关的理论知识进行了研究和探讨,主要包括中文分词、知网和信息检索模型;接着介绍了本系统提供的各项功能和具体实现方法;然后详细阐述了自然语言查询的基本过程。本文采用双向最大匹配法对问题进行分词,并利用知网语义关系对查询条件进行扩展。系统采用问题和答案分开存储的方式,针对题库结构的这种特性,采用基于文本段的向量空间检索模型,对传统的TF-IDF公式做了改进,并使用局部相似度和全局相似度相结合的方法实现检索结果的排序。实验表明,与传统向量空间模型相比,本文改进的检索模型具有更高的查全率和查准率,基本达到了设计的目标;查询速度也有较大提高,使其在网络平台上具有较强的适用性。本文在最后总结了本系统的特色,指出了系统目前存在的不足,并对答疑系统未来的发展方向进行了展望。
其他文献
在已有的有序决策树归纳算法中,选择条件属性和决策属性的有序互信息值最大的属性作为扩展属性,没有考虑到那些取值多且有序的条件属性和属性之间的相关性,这就造成了重复选
在CBT(Computer Based Training)课件开发平台中,很多的功能和应用都是以多媒体知识库为后台支持的,其中文本语言知识是最基本的知识形式,因此文本知识自动抽取成为CBT课件开
随着互联网的飞速发展,人们迫切希望获取一种方法,能够根据自己的需求,高效、快速地从海量的互联网网页内容中搜索出有价值的实时交通信息。然而,大量自然语言描述的交通信息
信息化是二十一世纪国家现代化的基本标志,也是一个国家综合国力的集中体现。对于作为“金融产业支柱”的银行而言,其信息化建设更是被赋予了极其重要的涵义,始终得到党和政
随着多媒体技术和计算机网络技术的迅速发展,数字图像的数量正以惊人的速度增长。为了有效的利用这些图像信息,需要采用某种技术,以便能够快速和准确的查找和访问图像,这就是
DICOM标准是应用于医疗系统中医学数字成像及通信的国际标准,通过它实现不同厂家设备间的医学图像和其他相关信息的传输。基于DICOM标准的打印服务器可以在不增加任何接口设备
2000年后商业网站的热潮带动了校园网的发展。同时作为国内与互联网相连的最大的学术网络中国教育科研网(CERNET)的成功建立和运行,也对我国教育和科研事业的发展起着重要的
随着信息技术的快速发展,网络信息的高度膨胀,网络设备的发展速度远远赶不上信息的增长速度,因此网络传输过程中出现了大量的拥塞。如何提高网络资源的利用率,提高网络的整体
数字半调是指通过量化操作将连续图像转化为二值图像的技术,而逆半调是半调的逆过程,由半调图像重构成连续图像的过程称为逆半调。现实生活中我们往往只能获取半调图像,如果要对
基于构件的软件开发得到了广泛地应用,而构件系统的测试仍然面临着许多问题,本文主要对构件系统集成测试的测试用例生成进行了研究。构件系统测试和面向对象系统测试既有相似