论文部分内容阅读
中文自然语言查询系统是数据库查询系统研究的重要分支,它是自然语言理解、数据库技术、人工智能、人机界面相结合的产物。它使用户可以直接以汉语自然语言的方式,向数据库系统发问并获得所需的信息,从而大大改善了人机交互的容易程度。近年来,设计数据库自然查询接口,已成为自然语言研究中最具有广泛应用前景之一。
本论文主要的研究目标是结合房产信息查询特定的应用需求,研究与实现一个基于受限的汉语自然语言查询系统。它允许用户在界面层输入受限汉语查询语句,然后通过一定的算法把用户的输入转换成标准的SQL语句,并在房产信息数据库中完成所要求的查询,输出查询结果。
本论文首先阐述本课题的研究背景和现状,在对已有技术总结基础上,提出汉语语法并能满足查询要求的受限文法规则。研究设计了适合房产信息系统的系统词典:通用词典、专用词典和关联词典。提出一种改进的分词算法--WSSD,该算法参照和单词相关的系统词典中给出的数据库语义,应用房产信息的领域知识,采用词典中长词优先的原则,以从左向右的顺序滑动与被切分的查询语句相匹配,实现了分词。在分词基础上,设计实现了面向房产信息查询的受限自然语言理解与数据库查询子模块,该模块实现了受限自然语言理解和类SQL描述。结合关联词典,采用适合本系统的“关联路径处理”方法,最终实现了类SQL语句到SQL语句的转换。
本文的创新点主要体现在:
1.提出符合汉语语法并能满足本系统查询的受限文法规则;
2.研究和设计了适合房产信息查询的系统词典;
3.提出一种改进的分词算法--WSSD算法;
4.设计实现了面向房产信息查询的受限自然语言理解与数据库查询子模块。
本文研究实现的是一个面向房产信息查询原型系统,仅对规则自然语言进行进行查询处理,还有许多改进之处,比如:受限汉语规则扩充,对不同应用数据库移植等,以便使系统更完善,实用性更强。