基于自然语言理解的中文自动问答系统研究

来源 :天津工业大学 | 被引量 : 0次 | 上传用户:xiazaisun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的迅速发展以及Internet的广泛应用,知识和信息在世界范围内实现了平等共享和快速传播,人们可以方便、快捷地从互联网络上获取信息;但网络信息的爆炸性增长,使得准确、快速地获取有价值信息的难度逐渐增加。人们面对的问题不是没有答案,而是答案太多,如何从海量数据中选择合适的答案,需要提供更强有力的信息获取工具,以应对信息爆炸带来的巨大挑战。问答系统正是这个方面的重要研究内容。   问答系统(Question Answering System,Q&A)是信息检索的高级形式,属于精确检索范畴。它接受用户以自然语言形式描述的问题(如:中国的首都在哪里?),并从大量的异构数据中查找出能回答该问题的准确、简洁的答案(如:北京。)。   本文系统地介绍了问答系统的研究内容及现状,并对中文分词、词性标注、句法处理、语义解释等中文问答系统相关的关键技术进行了较为深入的分析与探讨,本文主要研究以下几个方面的内容:首先,本文系统地阐述了问答系统的模块划分,并对各模块的功能和关键技术进行了理论性研究;其次,对中文分词、词性标注问题进行研究,提出了一种基于频繁项目集挖掘的词性标注方法,并将基于统计和基于规则的词性标注方法相结合,通过实验验证,此方法相对于传统的基于规则或统计的方法准确率显著提高;第三,通过句法分析判定句子的结构成分,将一个句子分解为短语,依次向下分解为子短语、词语,从而得到句子的实际结构,并运用了chart图分析句子结构,浅层句法分析消除歧义等;第四,阐述了语义解释的相关内容,详细讨论逻辑形式和最终的意义表示形式之间的区别,提出一种逻辑形式语言,利用语法中的特征体系,采用逐条规则的方式来识别逻辑形式解决了逻辑形式和语法结构相关联的问题,。   最后,根据上述研究内容我们设计了一个基于自然语言理解的非受限领域的中文自动问答系统,对本文所涉及到的关键技术进行了检验、评测,取得了理想的实验效果,能够部分满足非受限领域自动问答系统的需要。
其他文献
随着全球化,信息化的迅猛发展,网络带宽的增长和网络安全问题的层出不穷对网络数据包的处理性能提出了新的要求。VPN和防火墙是企业和个人用户实现安全传输网络流量的重要手
本文研究模糊逻辑中蕴涵算子的构造。主要内容如下:   第一章:介绍了模糊逻辑的发展及目前国内外研究的概况,给出了后面章节需要用到的一些定义、定理,并且介绍了[0,1]上几种
随着软件规模的不断扩大,软件测试工作的复杂程度也大大增加,软件测试的成本也在不断上升。如何有效的对软件测试工作进行管理,提高测试效率,变得十分重要。测试管理工具能够
机器翻译是自然语言处理领域的一个重要研究课题,对于目前高速发展的信息社会有着广泛的市场潜力和研究价值。随着科学技术的逐渐发展,基于图像识别的机器翻译开始引起人们的
如何提高网络入侵检测系统的实时性和适应性是网络入侵检测系统中的两大研究课题。为此,一些学者提出通过特征选择建立轻量级入侵检测系统的思想;另一些学者认为网络入侵检测
近年来,随着互联网的发展,一些社会网络,例如,国外的Twitter、Facebook、 Flickr以及国内的新浪微博、知乎等,用户量大且活跃度高,信息在网络中传播范围快而广,使得影响力最
随着信息技术的不断发展和互联网的迅速普及,人们从信息接收者逐渐转变为信息的生产者,信息的爆炸式增长推动着互联网进入大数据时代。如今大数据已经成为一种重要的战略资源
当今,社会已经进入了网络信息时代,中小学教师继续教育培训从传统的面授模式进入到了现代远程教育模式。在这种模式下,学员的学习内容、学习方法、学习时间、学习地点都发生
网格数据库是将数据库技术和网格技术相结合而形成的一个新的研究内容,是随着网格的发展而提出的新需求,其目的是把分布异构的数据库有效地集成到网格环境中。查询处理技术是
文本倾向性分析就是对用户对某个事物的看法或评论文本的挖掘,从而得到该看法或评论是属于对该事物的积极或消极意见,是文本情感计算的一个热点领域。文本倾向性分析中的主要