潜在语义分析中的SVD和SDD算法比较研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:szocean
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前信息检索技术面临着各种信息资源更新越来越快,用户检索结果要求越来越精确的严重挑战,如何有效地找到所需信息因而成为了一个关键问题,语义检索是解决这一问题的非常有潜力的方法。语义检索的核心要点是基于概念的检索匹配机制。潜在语义分析(LSA)是实现概念检索的重要方法之一。它的出发点就是文本中的词与词之间存在某种联系,即存在某种潜在的语义结构。目前存在着SVD和SDD这两种构造典型LSA空间的算法。  本文首先介绍了语义检索的相关知识。然后分别介绍了潜在语义分析中奇异值分解(SVD)和半离散矩阵分解(SDD)这两种矩阵分解算法的理论基础和实现过程。最后,分别从数学特性分析的角度和具体的信息检索应用实例来分析比较这两种矩阵分解算法。通过对SVD和SDD这两种算法的对比研究,可知半离散矩阵分解方法作为一种新的构造潜在语义空间的方法,在信息检索应用中也具有和奇异值分解方法同等的检索效果。SDD算法不仅弥补了传统SVD算法无法大规模应用的局限,而且结合它压缩比大等优点为基于LSA的信息检索提供了一种新的有效可行的矩阵构造算法。  SDD算法可以应用于数据压缩、文本分类、特征提取、数据过滤等领域,本文研究成果可以为SDD算法在语义检索中的应用提供理论依据。
其他文献
现代控制领域中普遍存在着不稳定的被控对象,其控制起来难度较大,而且不容易趋于稳定状态。普通的常规控制器无法对复杂的不稳定对象进行较好的控制,所以对不稳定对象选择一
我国的政府采购工作目前正面临着较为严峻的信息安全挑战.我国各级政府大量采购的境外产品和外国的服务软件不仅应用于日常行政工作,同样也应用在国家安全保密方面.这几年逐
如今是数字化时代,各行各业几乎都与数字化挂钩,在中医院档案管理工作开展的过程中,如何在数字化环境内实现转型,是促进我国档案事业健康发展的根本保证.档案工作的重要性不
互联网基础设施建设的不断完善、利好政策的持续出台,以及互联网对于各个行业的渗透,共同促进网民规模持续增长.随着“宽带中国”战略的深化,宽带网络的光纤化改造工作取得快
大数据的快速发展给人们生活带来了巨大变革,在高职院校档案管理工作中,也需要运用大数据技术提升管理效果.但是在其应用过程中仍然存在一系列问题,有些高职院校档案管理工作
本文以高动态GPS卫星信号模拟器的开发为背景,着重对其中涉及的两项关键技术(载波数控震荡器和码数控震荡器)的设计进行了研究。最后简要的对GPS卫星信号模拟器的软件部分以及
在当前大数据时代背景下,信息技术和大数据技术得以广泛应用,这也推进了医院信息化发展的进程.信息技术在医院中的应用,有效的促进了医院信息管理系统的建设.医院通过构建完
山东省的很多企业、事业单位也运用了网络信息技术与电子信息化管理模式管理档案文件,这在一定程度上促进了档案的管理效率,也让档案管理方式有了新的变革.这里我们浅谈电子