基于领域知识的中文短信理解模型研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:email_97
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中国移动短信业务的迅猛增长,用短信对数据库中的信息进行查询已经成为一种十分便利的信息查询方式。但现在大部分短信查询系统都要求用户按照规定的格式编写短信,这给用户的查询带来了许多不便。数据库自然语言查询系统可以使用自然语言灵活的编写短信,但自然语言理解方面遇到的困难使得中文自然语言短信查询系统迟迟未能达到实用水平。因此,研究中文自然语言查询短信的理解方法,对数据库中文查询系统的早日实用化有着十分积极的作用。本文根据中文查询短信的特点,提出了基于领域知识的中文短信理解方法,具体的工作内容包括如下几点: 1.词法分析方面,针对铁路票务领域查询句中词汇的特点,对词汇进行重新划分,构造了具有领域特征的分词词典。在分词词典的基础上,应用逆向最大匹配算法,完成对中文查询句的切分。 2.句法分析中,通过对查询句中查询目标和查询条件详细的分析,设计了能够覆盖铁路票务领域内大部分查询问句的语义文法。提出了图结构自顶向下分析算法同数据库语义相结合的方法,以此来完成句子结构的分析和句法成分数据库语义的获得。 3.在SQL命令的生成中,提出把具有数据库语义的语法树作为自然语言向SQL查询命令转化的中间形式,通过深度优先搜索算法搜索语法树,提取语法树中相应结点的信息,完成SQL查询命令的构造。 4.问答句生成方面,根据不同的的查询目标设计出相应的问答句模版,通过查询结果与问答句模版的组合形成问答句。 本文在总结了其它数据库中文查询句的理解方法后,针对铁路票务领域内的数据库中文查询问句提出了一套切实可行的理解方法,这一理解方法不仅适用于铁路票务领域内的数据库中文查询句,同时,也为其它领域中中文查询句的理解提供了一种思路。
其他文献
随着计算机技术和网络技术的迅速发展,信息传递的实时性和正确性有了很大的提高。现代企业的发展呈现出集团化、多元化的趋势,企业的生产、经营、管理分布越来越广,厂区跨越
本文主要针对某型号飞行器系统的控制舱,为在研制阶段进行参数的检测和飞行器联试时提供激励信号和对参数的检测,以检测该飞行器控制器是否达到预期的指标,根据系统对测试的要求
本文针对航空捷联式重力仪高精度测量受限于机体振动噪声与角运动干扰的问题,以实现双轴稳定平台水平随动跟踪为目标,设计了符合系统特性的数学模型,应用信赖域法求解非线性
在数据库系统设计理论的指导下,对工业变电站监控软件(动态、静态)数据库模块的总体构架、组成等问题作了深入的研究和规划,根据系统数据具有数据结构同一化、数据类型单一化和数据结构明确化的特点,定义了系统的数据字典,提出了基于线性表结构的数据存储模式。在VC++6.0环境下,利用内存映射文件技术重点考虑设计了工业变电站监控软件动态数据库模块。同时,分析了以ADO数据库接口技术来访问建立在SQL Serv
柔性制造和敏捷制造技术是先进制造技术的典型代表, 敏捷制造的主导特征包括快速性、精良性、动态性、高柔性。模块化制造系统(MPS)作为一种新型的柔性制造和敏捷制造的概念,
近年来,塔式太阳能光热发电成为太阳能利用的一个重要方向,其中定日镜的跟踪控制为其核心技术之一,也是难点之一。定日镜的跟踪是通过镜面法线目标角度值与镜面法线角度检测值之
本论文主要是对自适应终端迭代学习控制中存在的初始条件变化、参考轨迹变化等问题进行了进一步的研究,提出了一系列自适应终端迭代学习控制的新方法。论文的主要创新点及贡
人脸特征点定位是人脸识别和分析研究领域中的重中之重,它是诸如自动人脸识别、表情分析、三维人脸重建及三维动画等其它人脸相关问题的前提和突破口。近些年来,深度学习方法
SPWM波形的产生和控制方法是逆变器的核心技术之一。在一些特殊的应用领域,期望SPWM逆变器的开关频率和调制精度不断提高,特别是对于那些采用多重化SPWM技术的逆变器。基于串行
智能人工腿是机器人学和生物医学工程学领域一个备受关注的研究课题,它将智能控制理论、微电子技术、计算机技术、机械设计与制造及生物医学工程等技术融合在一起,具有能模仿人