基于语义分析的查询扩展及其关键技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:sdddddddd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
查询扩展作为解决词的不匹配问题的一种解决方案,有效的解决了目前Web信息检索存在的查全率和查准率低的问题,引起国内外很多学者的注意并参与。然而目前查询扩展方法仍然存在很大的缺陷,即无法同时解决自然语言中词汇的同义性和歧义性问题,本文在分析传统查询扩展方法不足的基础上,给出了基于语义分析的查询扩展方法。论文主要围绕以下几个方面作了重点研究:首先,介绍了传统查询扩展技术和系统构成,分析其优点以及存在的问题,在此基础上,描述了基于语义分析的查询扩展新方法的特点、技术流程。给出了新的查询系统地概貌和关键语言技术,如分词、词义消歧、同义词扩展、同范畴扩展、词语相似度计算等技术在文中都有简洁扼要的概括和说明。其次,实现了一种无指导的词义消歧方法,词义消歧研究在自然语言处理的许多应用领域中具有重要的理论和实践意义,也是近些年来是计算语言学和自然语言处理领域一个重要的研究课题。本文对词义消歧的相关研究方法和词义消歧的知识源进行了综合评述,针对当前词义消歧常见的问题,采用了一种均概率思想的无指导词义消歧解决方法。最后,讨论了词语相似度计算的应用背景,总结了词语相似度计算的两类策略,包括每类策略的思想、依赖的工具和主要的方法,给出了一种基于《知网》的词语相似度计算方法。基于语义分析地查询扩展可以弥补传统查询扩展技术中的诸多不足,在对用户的查询进行的分析和理解的基础上,准确把握用户的查询意图,这样再进行查询,目的更加明确,查询过程也更加清晰,减少查询的错误,有效提高系统的查全率和查准率。
其他文献
随着计算机网络的普及,网络游戏产业得到了迅猛的发展,已经逐步成为许多人消遣、娱乐的主要途径。其中,休闲及益智类的网络小游戏更是深得广大学生群体和白领们的青睐。近年来国
在智能科技日新月异的今天,自动识别技术已经受到众多研究人员及生产应用者的普遍重视。尤其是人脸识别,它是利用生物技术进行个人身份鉴定的一种重要手段,具有极高的研究价
随着国内通信市场快速的发展,各运营商所建立的通信基站越来越多,这些基站工作的稳定及可靠性决定了通信网络能否正常运作。因此基站的维护工作在整个通信产业中的重要性也逐渐
快速扩散制造是一种基于有限生产能力和制造资源的社会化联合制造模式,是一种建立在企业信息化和社会网络化基础上快速组织动员的战备方法。扩散制造资源具有异构性、分布性、动态性、多样性和可重用性等特点。如何不受时空限制地对该制造模式下的质量故障进行诊断是一个非常重要的课题。本文介绍了扩散制造的概念和故障诊断的现状,基于范例推理方法,并结合Web Services和XML技术对扩散制造中质量故障诊断进行了深
我国配电网大部分为中性点谐振接地系统,在配电网架空线路的各类故障中,单相接地故障占比最大。在线故障检测和定位是智能电网自愈功能实现的基础,目的在保证电力供应的情况下迅速确定、排除单相接地故障,提高供电可靠性。所以研究配电网故障定位具有重要的实际意义。行波故障定位是目前高压输电线路故障定位的主要方法,而由于配电网拓扑结构复杂、分支较多,故行波故障测距方法不能直接运用于配电网故障定位。本文针对配电网配
最优化问题在人类社会的诸多领域普遍存在,随着科学研究和应用需求的不断发展,在工程实践和科学研究中涌现出很多复杂的最优化问题,同时最优化问题的规模也在不断扩大,传统的最优
随着通信网络、传感器技术、智能计算等技术的发展,智能电网也得到了飞速的发展。在智能电网的大环境下,功能越来越强大的智能终端也得到了广泛的使用,用户的用电行为也变得复杂
随着Internet的普及,校园网的规模越来越大,功能也越来越强。在校园网日趋成熟的今天,我们同时也发现校园网存在着不少问题,诸如缺乏合理的管理模式,缺乏灵活的计费策略,网络
脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)是一种基于生物背景的神经网络。作为第三代人工神经网络,PCNN在图像处理领域有着非常广泛的应用,主要应用于图像去噪
复述是自然语言中非常普遍的一个现象,它集中反映了语言的多样性,已经被应用到信息检索、自动问答、信息抽取、自动文摘、机器翻译等多个领域。本文从相关语料库出发,运用多种自