山西旅游问答系统中的旅游问句分类研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:SAGDGJGU
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的迅速发展,旅游业已成为我国经济发展的支柱产业之一。山西悠久的历史留下众多的文化遗产,加上复杂的地形地貌、河流山川形成的自然景观,旅游资源十分丰富,是人们出游的首选地之一。而伴随着人们生活水平的提高,旅游的个性化时代悄然来临,越来越多的旅游者希望根据自己的特殊兴趣和爱好,选择有针对性、有主题、有重点的旅游方式。因此,在出行前,旅客更愿意先借助互联网的信息服务来设计自己的旅行线路、交通工具、入住宾馆等等。因此,人们迫切希望具有自动问答功能的山西旅游问答系统的出现。而旅游问句分类模块是旅游问答系统实现的重要基础。  本文对网上常见的与山西旅游有关的旅游问句做了详细分析,并对其进行分类,为后续山西旅游问答系统的实现奠定了坚实的基础。本文的主要工作有:  1)山西旅游问句分类体系  本文对目前已有的几类典型的与问答系统有关的问句分类体系进行详细分析,参考其分类的优点及分类依据的合理性,提出了一个适合山西旅游问答系统的旅游问句分类体系。  2)对山西旅游问句分类的实验研究  从提出的问句分类体系入手,首先研究了与问句分类相关的几种主要技术;其次着重探讨了四种用于问句分类的分类方法;再次,研究了实验采用的评价指标和词特征的选取方法;最后,在词特征基础上根据实验任务的不同,在实验数据集上进行了相应的实验,结果表明:在提出的问句分类体系下,采用词特征使用简单投票分类方法对山西旅游问句分类时,问句分类正确率最高。  3)问句分类问题的多粒度分析  研究了词汇级特征、短语级特征的抽取方法及词汇级特征、短语级特征、综合考虑词汇级特征和短语级特征的多粒度特征对山西旅游问句分类的影响。实验结果表明:多粒度特征使用支持向量机分类方法对问句分类的正确率最高。
其他文献
为使系统的通用性更好、适用性更强,该文通过软件体系结构的六种视图完整刻划出机场营运系统的通用体系结构,它们分别是:业务体系结构、组织体系结构、位置体系结构、信息体
该文对统一潮流控制器物理模型运行机理进行了的理论分析;并在统一潮流控制器物理模型的电压逆变器控制原理方面,应用优化消谐理论对逆变器的控制方式进行了完整的理论推导.
该文论述高可用集群系统的设计和实现.文中概述了系统可用性研究方面的相关工作,简要介绍了集群计算模式,讨论了集群软件设计中的问题,然后以HACMP为例,剖析了层状集群软件的
SOA(Service Oriented Architecture,面向服务的架构)是一种架构模型,它可以根据需求并通过网络对松散耦合的粗粒度应用组件进行分布式部署、组合和使用。更加灵活的业务,更低的成
课件的开发是CAI的关键.据统计课件开发耗时与运行课时之比约为200:1,因此提高CAI软件的开发效率实用当务之急.基于面向对象的软部件技术是目前国际软件工程学科的前沿,传统
现如今的旅游系统容纳范围都较单一,例如旅游规划、旅游景点管理、旅游局日常管理等方面都是分离的系统,旅游局工作人员使用时有时需要开三至四个系统,需要重复输入用户名和密码
软构件式的CAI系统通过在体系结构中加入领域知识构件和教学环节构件,引入了领域知识实体对象和教学环节对象.领域知识实体对象的引入,一方面使领域知识的内容描述信息成为可
在该文中,通过对计算机局域网络系统可靠性的研究,充分发挥冗余容错技术在网络系统中的作用,提出一种容错网络系统体系结构及容错层的方案设计.通过对网络容错结构可靠的分析
数据仓库与数据挖掘是在对信息资源更充分、深入开发的迫切需求下产生并迅速发展起来的新兴技术,是先进的数据库技术.该文对数据仓库与数据挖掘这两种技术作了概念提升和广义
蚁群算法在组合优化领域已得到广泛的应用,但对于求解饲料配方问题的研究则很少。本文通过对蚁群算法基本理论的研究,从经典的蚁群算法模型中,抽象出解决问题的一般方法,提出了在