潜在语义索引相关论文
全球恐怖主义因其异常活动而导致经济损失,网络战争和网络犯罪,给刑事司法系统带来了挑战。因此,通过准确地从大数据中提取犯罪信......
本文是在对几种比较经典的聚类算法对比分析的基础上,利用自组织映射网络在拓扑保序和抗噪声能力等方面的优势,以自组织映射模型作为......
随着文本信息的快速增长,特别是Internet上在线信息的增加,文本(网页)分类显得越来越重要。由于文本分类有助于用户有选择地阅读和处理......
随着WEB上图片资源的日益丰富,人们对WEB图片检索的需求也日趋强烈.基于文本的WEB图片检索技术,是人们当前检索WEB图片的主要手段.......
文本自动分类是组织和管理文本信息的有力手段,可以在较大程度上解决信息杂乱无章的问题,使用户更容易更准确地定位所需的信息。目......
模式匹配在许多领域中扮演着重要的角色,如模式集成、数据仓库、电子商务、数据集成等。但是由于模式表达形式的多样性、模式异构......
Internet技术的迅猛发展和空前普及给人们带来了诸多方便的同时,也带来了很多问题。网络在传播有用知识和信息的同时,也正在被不法分......
潜在语义索引模型(Latent Semantic Indexing, LSI)是经过实验验证的文本分类技术中行之有效的维数约简算法之一。潜在语义索引模......
在互联网技术高速发展的时代,各种数据充斥在网络上,数据的信息量繁杂,人们对信息数据的质量提出了更高的要求。如何有效获取用户......
随着信息技术的发展,人们需要对大量的文本资源进行有效的组织,以利于主题发现、信息检索等。于是,文本聚类技术应运而生,它是自然......
随着科技的进步,科技创新越来越受重视,但目前科技项目评审缺乏科技创新参考指标,因此需要对以往科技项目创新性指标进行分类,提高......
网络已经发展成为人们生活的重要部分,网络上存储的信息是海量的,而且处于不断变化中。网络用户期望得到个性化的服务,网络服务端......
自然语言中普遍存在着同义词和多义词现象,致使人们很难通过以词形匹配的关键词检索寻找到真正需要的网络资源。潜在语义索引通过......
对等计算(Peer-to-Peer Computing,P2P)是在互联网上实施网络计算的一种新的计算模型。P2P打破了传统的Client/Server(C/S)模式,网......
伴随着网络的迅猛发展,人们要接受的信息数量也成几何级数的增长。面对Internet中海量的、纷繁芜杂的信息,如文本信息、声音信息、......
随着计算机和通讯技术的发展和进步,人类社会进入了信息社会。Web网页是网络信息传播的主要途径之一,随着网络技术的发展,web网页信息......
随着计算机技术和信息技术的不断发展,尤其是互联网技术的日新月异,使得人们能获得信息成几何级飞速增长。但是面对着这些浩如烟海而......
20世纪90年代以来,Internet得到飞速发展.作为最大的信息集散地,Web上具有海量的信息数据,成为人们工作与学习的平台之一.如何从数......
本文分析是文本处理领域中的重要内容,它可以有效地改进文本检索、文本过滤以及文本摘要的精度.本文简要描述了文本的物理结构和逻辑......
在信息检索中,潜在语义索引模型直接应用于文本分类时,由于对分类贡献大的特征可能丢失而效果不佳.而考虑了文本特征及分类信息的......
为建设和谐文明的网络环境,提升对网络不良文本信息的识别和应对能力。文章使用一种新颖的基于增长型自组织特征映射(GSOFM)和潜在语......
提出了一种基于潜在语义索引(LSI)的“垃圾”邮件过滤方法,讨论了邮件概念空间的构造,该空间中邮件相似度的计算和“垃圾”邮件的过......
特征选择和分类算法是网页文本聚类中最关键的技术。提出对网页文本提取特征值后,利用潜在语义索引对网页文本降维,采用支持向量聚......
综合文献自身客观价值和相对于查询用户的主观价值,提出了基于用户行为分析的文献阅读价值评估方法。首先,分析用户行为并构建下载......
LDA没有考虑到数据输入,在原始输入空间上对所有词进行主题标签,因对非作用词同样分配主题,致使主题分布不精确。针对其不足,提出......
视频语义概念检测是跨越"语义鸿沟",实现基于语义的视频检索的前提。其中,视觉词典法是一种有代表性的方法。针对视觉词典法的两个......
自动文摘是自然语言处理领域的一项重要的研究课题。提出一种基于潜在语义索引和句子聚类的中文自动文摘方法。该方法的特色在于:......
针对源代码中一些非结构化的自然语言描述信息进行语义聚类,辅助开发人员开展程序理解。主要利用自然语言处理技术对程序中的标识......
展示了一种从大规模文本中学习文本索引的深层图形模型,深层图形模型采用自编码器作为基础结构。该图模型最终输出的值具有较强的......
研究了潜在语义索引在中文自动问答系统FAQ库构建中的应用,并着重阐述了句子相似度的计算方法以及使用LSI对FAQ库去重的实验选取方......
启动子是基因前面的一个短序列,定位启动子即能找到基因,因此启动子的识别具有重要意义.潜在语义索引差异模型(DLSI)能够扩大类间的......
目前P2P网络中的资源发现已经成为一个重要的研究课题.对P2P网络常见的几种搜索方法进行了介绍,包括非结构性的搜索方法和结构性的搜......
将潜在语义索引(LSI)应用于垃圾邮件过滤领域,并将其与向量空间模型(VSM)和经典的邮件过滤器SpamAssassin系统进行比较.另外,对基于词提取......
由于辅助阅读的需求,给出了中文文本的可视化表示,以直观的方式逐级显示文中内容,其基本思想是:利用潜在语义索引的方法,改进文本分类的......
应用奇异值分解方法,分析相关文本词条和图片语义的关系,构造了一个图片'潜在语义索引'模型,用于缓解传统的许多WEB图片检......
提出一种基于领域本体潜在语义索引和奇异值分解的图像数据查询算法,将查询扩展向量映射到潜在语义空间,根据相似度计算方法计算查......
为了更合理的排名Web文档本文提出了一个新的链接分析模型。该模型结合了基于马尔科夫链的链接分析技术和基于潜在语义索引以及文......
潜在语义索引被广泛应用于信息检索、文本分类、自动问答等领域中。潜在语义索引是一种降维方法,它把共现特征映射到同一维空间上,而......
由于文本表示直接影响文本分类的效果,该文提出了一种有监督局部保持索引的文本表示方法.该方法利用Jaccard系数确定同一类别中文......
本文详细介绍了自动文摘抽取的六种方法的基本原理,最后,在潜在语义索引模型选取法的基础上,提出了一种基于LSI语句聚类的语句选取......
信息过滤是一种WEB信息服务的新技术,旨在实现网络服务器向客户端主动的信息推送,其核心技术之一是用户兴趣主题模型的表示,文章利用......
提出了一种基于潜在语义的科技文献主题挖掘方法,描述了科技文献的主题挖掘模型。对科技文献集进行预处理,计算特征词权重,构造出......
为了解决传统的CBIR系统中存在的"语义鸿沟"问题,提出一种结合语义特征和视觉特征的图像检索方法。将图像的语义特征和视觉特征数据......
通过对全局模型和局部模型的分析,提出一种新的潜在语义索引差异模型,能将类别信息反应在词项中、以医学网页为实验对象,将网页中的文......
讨论了中文文本聚类的现状以及存在的问题,介绍了向量空间模型,详细阐述了潜在语义索引理论以及采用该模型进行中文文本聚类的主要......
针对《机械设计基础》精品课程,提出了一个基于潜在语义索引的智能答疑系统,并对其中的中文分词技术和句子相似度计算进行了研究,......