文档检索相关论文
针对当前文档间关联性弱、文档数据和其他数据相互隔离、传统文档检索方式单一等问题,提出了文档知识图谱构建及其智能检索的方法。......
全文自索引技术是指在庞大的文本资料上所建立的一种数据结构。该结构可以在原文档集合中实现高效的模式串计数、定位查询等工作;......
主要介绍"中华烹饪文化"本体的构建以及基于该本体的文档语义标注方法两部分。在本体构建部分,采用手动添加、机器自动导入和人工......
随着企业生产方式和项目研发模式的改变,企业信息化建设的加速,企业和高校内部各种信息资源库的建立以及扩张,数字资源成指数形式......
在应答一个来自用户的查询(query)时,现代搜索引擎会返回给用户前k个相关的查询结果及其摘要。摘要是一小段摘选于文档的文本,该段......
对目前问答系统的性能分析表明,用于答案抽取来源的文档的相关性是制约问答系统性能的主要因素。相关文档检索作为问答系统的一个......
对文档进行语义哈希是一种比较常见的加速相似性查找的方法。所谓语义哈希就是将文档进行哈希编码,并且使得在语义上相似的文档能够......
随着计算机的普及和现代网络技术的发展,文档在线阅读和共享已经成为现代社会人们获取知识的一种普遍途径。作为对传统出版物的重......
信息系统是一种描述关于感兴趣对象相关定性与定量信息的标准形式。这一形式是进行信息处理任务的起点,也常被作为数据分析工具与......
槽填充(Slot Filling)旨在从大规模语料中抽取目标实体的属性信息。该研究包含两方面关键任务:1)源信息(相关文档)获取,其任务是根......
本文研究了Top-k文档检索问题,即对给定的文档集D={d1,d2…,dn},对D构建索引,通过相关的打分函数给每个文档进行打分,使得对任意给......
随着国内高校科研管理信息化的不断发展,各类科研文档数据迅速增长,如何有效地组织和利用这些科研文档数据,是目前亟待解决的问题......
内容管理系统是一种位于WEB前端(WEB服务器)和后端办公系统或流程(内容创作、编辑)之间的软件系统.内容的创作人员、编辑人员、发......
Web2.0技术开启了信息爆炸的时代,面对铺天盖地的互联网信息,用户需求的往往不是搜索引擎返回的大量网页,而是从网页中提取的结构......
20世纪90年代以来,Internet得到飞速发展.作为最大的信息集散地,Web上具有海量的信息数据,成为人们工作与学习的平台之一.如何从数......
随着互联网的发展和改进,越来越多的分布式管理系统通过Web网络实现信息共享,Web网络传输的信息也不再仅仅是文档文字,同时还包括......
分析当前常用的两类扫描文档检索方法:基于OCR和基于词形状编码的方法.提出基于识别信度将两种方法进行有机结合的思路.基于文档排......
Dublin Core元数据在文档描述中被广泛使用。文章首先对Dublin Core元数据进行简短介绍,然后阐述对数字文档进行检索的几种方法,最后......
现有文档检索软件大多存在功能耦合过于紧密、软件难以重用、可扩展性不好等问题:提出了一种面向服务的文档智能检索平台SODIRP(Serv......
探讨把文档检索中的二值独立检索模型改进后应用于FTP文件检索.解决现有仅通过字符串匹配检索时存在的无法按相关程度排序结果和因......
Web文档聚类在Web信息检索中起着重要的作用。文中提出了一种新的Web文档聚类和检索算法。该算法采用有序聚类的方法,根据Web文档的......
开发人员通常通过问答网站的搜索引擎进行相关软件问答文档的搜索。在检索结果中,包含优质代码片段(使用示例)的问答文档往往更受青睐......
文章针对列表类自动问题回答的任务要求,提出了一种基于短语检索和答案距离排序模型的列表类问题回答的方法。该短语检索模型在传统......
文本自动分类技术是随着网络信息化而发展起来的。它的作用是将各地海量的电子资源通过网络联系在一起,实现资源共享。本文通过对......
文章简要介绍了XML的家族构成及其相应功能,分析对比了了该项技术所具有的优势.基于XML技术的文档搜索引擎具有更高的全面性与精确......
针对自动问答系统,介绍如何用事例推理模型(CBR)来解决中文自动问题问题。提出了范例文档库的表示结构,关键词的抽取方法,候选答案集的......
本文提出了一种基于用户兴趣偏好的网络文档检索策略。用户长期浏览网页的过程中搜集用户的兴趣偏好特征值,并将表达用户偏好的关键......
快速相似性检索技术对于各种信息检索应用都具有很大的意义,其中基于语义哈希的快速相似性检索即是一个合理有效的检索方式,其检索......
<正>福清核电5、6号机组是国内首家采用"华龙一号"自主核电三代压水堆技术的示范工程,其开工建设对提高我国核电自主创新能力,掌握......
针对当前企业对文档保密与检索功能的双重需求,提出一种添加模糊匹配Hubble.Net保密文档专用检索阅读方法。采用AES(Advanced Encry......
目的:通过引用人工智能技术,解决电子病案管理系统中存在的缺陷。方法:采用文字识别、语音识别、生物识别、人脸识别等技术,对电子......
随着电子文本信息在机构内部的快速增加,人们无法应对堆积如山的文档,许多文档无法实现其信息价值,如何充分利用这些文本信息资源已成......
随着计算机的普及和大数据时代的来临,个人计算机中文档的版本数急剧增加,用户想要迅速找到所需的文档绝非易事.相关研究表明,文件......
元数据描述文档在检索过程中仍然存在着检索词和描述词不匹配的问题。文章在准确描述领域概念之间关系的概念网的支持下。给出检索......
随着信息化应用程度不断提高,企业中越来越多的文本信息被存储在PDF文档中,PDF文档的数量也随之变大,为了帮助用户尽快找到需求的......
提出一种潜在文档相似模型(LDSM),把每对文档看作一个二分图,把文档的潜在主题看作二分图的顶点,用主题问的加权相似度为相应边赋权值,并......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
在计算机的普及率越来越高的今天,每天产生的电子文档也越来越多,这些文档大部分是使用者的经验总结,然而它们大多分散在各个用户的计......
文档检索是自然语言处理的研究热点,相对于短文本文档具有信息丰富且冗长的特征。在长文本检索中,查询语句与长文本中的句子往往不......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
伴随着全球信息化应用水平的提升,智能化IT运维管理平台已经成为互联网企业的投资重点,平台被大量的数据和信息所覆盖,造成运维管......
文档检索是针对大文档集的一种常见操作。随着云计算技术的发展,越来越多的用户将自己的文档集放置在云端,一方面免于携带各种存储数......
随着互联网的普及和互联网内容的不断丰富,如何通过有效的方式获取需要的信息显得尤为重要。搜索引擎很好地解决了这个问题,成为了......
针对维吾尔语Web文档的有效检索问题,提出一种基于相关反馈和文档相似度的检索词加权方法.首先,对维吾尔语文档进行预处理,获得相......