面向地图搜索领域的自然语言句子查询语义意图理解方法研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:Daemonman
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究面向地图搜索领域的自然语言句子查询语义意图理解问题。查询语义意图理解对搜索引擎及自动问答系统的进一步发展和完善十分重要。随着语音搜索和智能搜索的发展,出现了越来越多的面向自然语言句子的查询。现有的查询意图理解研究对象大多是基于关键词的查询输入,没有考虑到面向自然语言句子查询背后的复杂信息需求,同时忽略了此类查询中不同成分间存在的依赖关系和结构。所以已有的查询语义意图理解方法不太适用于面向自然语言句子的查询。本文主要通过两部分的研究来探索面向地图搜索领域的自然语言句子查询语义意图理解问题:面向文本的中文地址规范化任务和面向自然语言句子查询的语义意图理解。  由于地图搜索领域的自然语言句子查询中包含多种不同查询成分,如何正确识别出这些成分和其中的地址元素是理解面向地图搜索领域的自然语言句子查询语义意图的必要因素。然而中文地址元素识别面临着完整性、多样性、歧义性等多重困难,且上述地址查询通常隐含由地址语义元素组成的语义模式。因此本文首先提出面向文本的中文地址规范化任务,它能识别出该类地址查询中的不同成分及地址元素。实验表明本文的方法较传统的标注方法取得了更好的准确率。  在上述中文地址规范化研究基础上,本文接着提出了一种面向地图搜索领域的自然语言句子查询语义意图理解方法。首先引入了层次化的树状结构来形式化的表示自然语言句子查询的语义意图,其包含有不同的查询成分知识且有查询成分间存在的依赖和关系。其次提出了一种基于结构化SVM的查询语义意图表示自动化学习算法。该算法可以根据查询语义意图表示的内部结构来生成相应的特征函数,从而使得该方法较传统的结构化解析方法可以采集更多的特征帮助模型训练学习。实验表明本文的方法较经典的方法获得的更好的结果。
其他文献
在最近的二十年里,电子格式存贮的数据以惊人的速度激增,形成了海量的数据和信息。数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在其中的信息的一种新技术,包括统计学习和
网格计算是为了在动态的、跨机构的“虚拟组织”中协同地资源共享和问题求解而提出的技术。网格技术由起先为解决科学和工程计算问题而提出的“计算网格”发展到现在的“服务
基于P2P技术的电子商务平台不需要集中式的中央服务器,信息交流更直接更灵活,同时用户能更好地把握自身的安全和隐私。相对于集中式的电子商务模式,其投资少,形式灵活,更符合
目前,建筑施工企业的资料生成与管理是一个难题。建筑施工企业在生产过程中需要产生大量的技术和管理资料,传统方式下这些资料由技术员与资料员手工绘制,这会消耗大量的人力物力
乳腺癌是危害人类健康的恶性疾病之一。目前,早期检查和早期治疗仍是提高乳腺癌治愈率的关键。超声医学技术是继X线钼靶照相技术和CT后,在医学中发展最为迅速、应用最为广泛
本文旨在研究蚁群算法原理的基础上,开展包括基于蚁群算法的分类和聚类问题的数据挖掘方法研究,并针对地震数据的特点,将所研究的方法在地震预测上加以应用。为了提高算法的计算
随着当今世界互联网的快速发展,Web已经发展成为一个巨大的和共享的信息空间,这些大量的数据可以为进一步的数据集成、数据挖掘等系统提供数据支持,Web数据抽取正是为了研究
随着以计算机技术、通讯技术、消费电子技术为主的IT产业的快速发展,在科学研究、工程设计、军事技术、商业娱乐以及人们日常生活的各个领域中,嵌入式实时系统得到了越来越广泛
人脸识别是生物特征识别中的重要方向,其具有自然、友好、无侵犯性等诸多优点,并且人脸数据的采集十分方便,因此人脸识别目前已成为生物特征识别领域里研究的热点。本文针对人脸
人脸识别与其他生物特征相比,其优点在于自然、友好、无侵犯性,并且人脸库采集简单方便,目前已成为生物特征识别领域里研究的热点。本文针对传统方法的优缺点提出了一种新的