基于知网的内容知晓研究

来源 :太原理工大学 | 被引量 : 1次 | 上传用户:haili20102010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网的迅速发展,因特网上的信息每天都以指数量级的速度爆炸性增长,如何从这个浩瀚的信息资源库中获取用户需要的信息,是人们面临的一个重要问题。搜索引擎是目前最有效的手段,据中国互联网络信息中心(CNNIC)2004年1月的最新调查统计表明,搜索引擎以占网络服务使用率的61.6%仅次于电子邮件的使用率,可见搜索引擎的重要性,但是当前的搜索引擎的工作效率却并不高,查全率和查准率都有待进一步提高。 本文在了解本体论的国内外研究现状并进行综合比较后,选定知网来实现内容知晓,并用它来来解决当前搜索引擎效率低的问题,针对于用户在使用搜索引擎进行检索时不仅希望获得包含检索关键词的文档,还希望得到与关键词内容相关的文档,对知网进行认真仔细的研究后,提出了一个基于知网的内容知晓模型及词语相似度算法,词语相关度算法和资源语义相关度算法,对用户输入的关键字进行相似度和相关度计算,将在内容上一致的词都归入搜索关键词,形成新的关键词集合,扩大搜索的覆盖度,以提高搜索引擎的查全率;对于在资源中查到的结果进一步计算其与用户搜索内容的相关性,按大小排序返回用户,来提高搜索引擎的查准率。在对检索关键词及资源实现内容理解的基础上进行
其他文献
随着信息时代的发展,多媒体技术作为计算机通信、信息存储、Internet网络传输等信息技术的最活跃的研究领域之一,引起了业界人士的广泛关注。其中,图像数据因为能给人们以直观、
商用搜索引擎对查询请求的处理速度有很高的要求,尤其是在因特网已发展到数百亿网页规模的背景下,如何在保证返回结果质量的前提下,尽可能提高搜索引擎查询处理能力成为了搜
随着遥操作机器人技术的发展,人们不再满足于SOSR遥操作系统的工作能力,更多的转向MOMR系统的研究。而目前国内外这方面的研究大部分还仅限于协作型遥操作,对于一些新兴的遥操作
SIP(SessionInitiationProtocol,会话初始化协议)是由IETF(Internet工程任务组)提出的IP电话信令协议。目前SIP工作组发表的协议和草案超过30个,除了核心协议以外,其他协议涵盖Q
基于知识工程的系统研究历来是计算机理论及应用研究的前沿之一,但是知识获取的瓶颈问题,一直束缚着研究人员的研究进程,而范例推理系统(CBR)恰能较好地解决这个问题,目前已广泛
随着虚拟化软硬件技术的发展与成熟,虚拟化技术已经被广泛地应用于云计算等基础服务设施领域。虚拟化技术的目的是为了实现物理资源的动态扩展以及按需分配,这需要虚拟化环境能
随着信息技术的发展,企业的信息化水平不断提高。企业在信息化建设的过程中积累的大量数据构成了企业的异构数据环境。异构数据集成问题已经成为目前的研究热点之一。本文讨论
授权管理基础设施(PrivilegeManagementInfrastructure,PMI)的目标是向用户和应用程序提供授权管理服务,提供用户身份到应用授权的映射功能,提供与实际应用处理模式相对应的、与
随着因特网应用的发展,XML已经成为新一代因特网数据组织和交换的事实标准,XML数据的以XML原生数据库的方式存储与检索成为当前研究的重要方向,为XML原生数据库添加和传统主
现代化社会,计算机与日常工作生活密不可分。然而伴随着社会的快速发展,计算机的安全问题日趋严重,一个威胁计算机安全的重要因素就是软件中存在漏洞。COTS即Commercial-Off-the