企业级搜索平台综述与功能设计

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:lovezjx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
企业级搜索是用户搜索习惯在组织中的延伸,是一种随着搜索引擎的普及和习惯的养成后逐渐形成的一种组织的需求,即在组织内整合获取工作所需信息的需求,包括企业、网络媒体、政府机关、教育科研等,属于搜索引擎的高级应用。企业用户对信息的需求不仅仅限于简单的查询结果,而是结合搜索、数据库查询、语义和句法分析、分类和聚类、相关性分析等技术,整合现有的信息资源,提炼出具有商业价值或社会价值的数据支持。 企业级搜索从实质上已经超越了简单的Search——单一搜索的概念,而进入了内涵与应用都更为丰富的信息内容获取、组织与传递技术。从这个角度来说,企业级搜索的本质就是对于非结构化数据的运算,是建立基于内容逻辑的非结构化数据的关系体系,从而在这一关系基础上实现更多更丰富的应用和操作。即在非结构化数据应用中实现如现代关系型数据库在结构化数据中的应用。 本文分析了八个国内外提供企业级搜索服务平台的产品的特点。其中国外的产品有:挪威企业FASTSearch&Transfer公司的FASTESP系统、英国企业Autonomy的IDOLK2系统、美国公司Endeca的TheEndecaInformationAccessPlatform系统、IBM的OmniFind系统、Oracle的OraclSecureEnterpriseSearch10g系统,国内产品有:百度公司的BaiduESP系统与TRS拓尔思的企业搜索引擎服务平台等产品。 通过对上述这些企业级搜索产品的分析,我们可以发现它们在企业级搜索平台系统中的基本架构都由信息获取环节、信息分析标引环节、信息加工处理环节、信息服务环节、丰富的接口层等基本环节构成。这些环节集成了对整个企业或组织的各种信息进行采集、监控、分类、检索、流转、分析、权限控制及安全控制的各种功能模块,构建起了能够对组织内非结构化数据综合处理和应用服务的企业级搜索平台。 因此,中文企业级搜索平台CESP即在综合国内外相关企业级搜索技术与产品和国内用户对中文企业级搜索产品的典型需求的基础上被适时地提出。 中文企业级搜索平台是一个以中文处理,兼顾多语种搜索技术为核心的非结构化数据运算与操作平台,为用户提供各类信息的综合处理和传递获取服务。它从整体架构上分为:数据获取层、通用数据网关、数据分析处理层、管理系统、接口层和应用插件层等部分。每部分由相关的功能模块构成,形成独立的模块化组件架构,可以根据用户的需求选择采用不同的组件模块进行组装,构建起符合用户需求,为用户量身定制的中文企业级搜索应用服务系统。
其他文献
中国图书馆学会专业图书馆分会2009年学术年会于9月13-17日在青海省西宁市成功举办.来自全国各类型图书馆170多名正式代表及10余名青海省当地图书馆工作者出席了会议.
进入21世纪以来,经济全球化已经成为整个世界发展的总体趋势,经济资源越来越多的在全球范围内进行优化配置,而各种政策和法规也越来越多的为全球化进程而服务。在全球化的大背景
学位
气象预报是影响大气重污染预报精度的关键所在.针对2016年12月16~21日北京市一次重污染过程,开展了中尺度气象模式WRF的参数化方案配置敏感性试验.对微物理过程、长波辐射过程
[目的]探索动物机体遭受低温应激及细胞冷冻过程中胰岛素样生长因子1(insulin-like growth factor,IGF-1)与RNA结合基序蛋白3(RNA-binding motif protein 3,RBM3)之间的作用
本文主要探讨了在国外对华反倾销愈演愈烈的形势下,如何有效进行相关情报监测,为应对反倾销提供支持的问题。 频频发生的对华反倾销不仅给我国企业带来很大损失,而且对我国相
期刊
1 前言由中铁十五局集团第一工程有限公司施工的渼陂湖水系生态项目水利设施二标段,萯阳门大桥作为标段最大的单体结构物,横跨涝河,长139m,双幅宽35m,双向横坡1.5%.上部结构刚
期刊
The seasonal variability and spatial distribution of precipitation are the main cause of flood and drought events. The study of spatial distribution and tempora
随着计算机和网络技术的快速发展,更多的信息资源通过网络进行传播和使用,信息资源的下载和复制变得异常容易,导致版权人的权利受到了严重的威胁和侵害,人们开始采取各种技术
学位
机读目录(MARC,Machine Readable Catalogue)作为一种元数据格式.在信息描述、存储、交换、标准化和检准率方面具有不可比拟的优势。经过50多年的发展和住国内外图书馆界的广