基于潜在语义分析的语义搜索原理及实现研究

来源 :福州大学 | 被引量 : 4次 | 上传用户:Ruiming123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今的互联网已经进入了多元信息化的新阶段,网络信息搜索技术已经得到了广泛应用。传统的搜索系统一般基于关键字字面内容匹配进行信息查询,很难真正表达用户潜在的查询需求。语义搜索是一种区别于传统的基于关键词匹配的信息搜索方式,在语义层面上准确地分析用户的搜索意图,并返回反映用户潜在搜索动机的语义信息。因此,如何从语义层面理解和挖掘用户真正感兴趣的信息,是当前信息搜索领域亟需解决的问题。潜在语义分析技术是一种用于知识获取和展示的信息检索代数模型,并被广泛应用于文本分类与聚类、信息抽取、信息搜索、图像检索等领域。特别是在信息搜索领域,潜在语义分析技术可以将词语和文档以某种程度上代表其语义的形式表示和存储,并用于语义搜索,从而使信息搜索系统可以在一定程度上“理解”用户的查询请求,高效地提供用户所需要的信息。本文在分析了传统的基于关键词匹配的搜索技术和其他语义搜索方法的不足的基础上,对基于潜在语义分析的语义搜索原理进行了深入研究,探讨了语义搜索的实现方法,采用了文本内容清洗、中文分词、关键词提取、潜在语义分析、语义查询扩展等信息处理技术,开发了一个基于潜在语义分析的语义搜索原型系统,从而在语义层面上理解和处理用户的查询请求,挖掘用户的真正需求,提升信息搜索系统的查准率和查全率。另外,本研究丰富和发展了潜在语义分析技术与语义搜索相结合的机制,实现了从传统的以语法为核心的搜索模式向以语义为核心的搜索模式的成功转变,高效并及时地发掘可用的信息资源,为用户提供合理的信息推荐策略。最后通过构造数据集并在语义搜索原型系统上进行训练实验和测试实验,结果表明:潜在语义分析技术可以在一定程度上挖掘词语之间的语义关系,在提取大批量文本的潜在语义信息和挖掘用户真正需要的信息方面具有较为优越的性能。因此,对潜在语义分析技术和语义搜索相关理论的研究、将潜在语义分析应用于语义搜索领域对于改善传统的搜索方式的搜索效率、发展和完善信息检索理论体系具有较为重要的意义。
其他文献
基于空气静压导轨气膜支撑区气体分子运动和碰撞规律,提出气膜分层理论,将气膜支撑区的气体划分为近壁层、稀薄层、连续流层,给出划分稀薄层和连续流层的依据,建立物理模型并
提升国有企业党组织组织力,把党员有力有效地组织起来、把群众有力有效组织起来,是加强党的建设的一条宝贵经验,对于基层党组织来说,提升基层党组织组织力是一个持续、系统的
教育人性化是人的生物属性、社会属性和精神属性和谐发展,实现个人自由和社会制约性、个别差异和人类共性、理性与非理性的辩证统一。根据马克思以来的西方马克思主义理论,尤其
教学过程是师生相互交流的多边活动过程,师生以什么样的心境进入教学过程是影响学生主动参与学习并取得教学效果的重要因素之一。在课堂教学过程中,教师不应成为“居高临下”
高职院校作为高等教育体系的重要组成部分,在为区域输送高技能实用型人才、推动区域经济健康发展方面发挥了重要作用。近年来,高职院校尽管在人才培养规模与教学质量等方面实
<正> 一、金融结构内涵及变动 1.金融结构内涵。美国金融学家戈德史密斯教授在《金融结构与金融发展》一书中提出,“金融结构即金融工具和金融机构的相
对于任何一家企业来说,上市不光意味着机遇,更意味着风险。在新媒体竞争愈发激烈的今天,资金的保障无可厚非地成了各家媒体快速发展的重中之重,而如何高效地融资也自然而然地
19世纪末法国戏剧评论家布伦退尔以戏剧冲突的类型来划分悲剧、正剧和喜剧。其"冲突说"的戏剧性理论正解释了元杂剧《鲁大夫秋胡戏妻》对悲剧故事《鲁秋节妇》的改编原理:通过对
目的:研析脑卒中吞咽功能障碍患者运用集束化护理的成效。方法:择取本院2017年10月-2018年11月接收的102例脑卒中吞咽功能障碍患者资料,51例行集束化护理(研究组),51例行基础