表格信息抽取引擎的设计与实现

来源 :计算机科学 | 被引量 : 0次 | 上传用户:ch32918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
讨论针对Web表格的信息抽取,分析并给出了表格信息抽取引擎的系统结构,以及实现该系统所涉及的关键技术和数据模型,为用户提供一种以Web表格为信息抽取对象的、支持抽取方式选择的Web表格信息抽取工具。
其他文献
以CNKI为文献来源,对我国有关信息资源利用评价的研究,从文献外部分布规律和文献信息资源利用评价状况进行了梳理分析,以期更有效地发挥信息资源的功效,对后续研究提供借鉴。
通过CNKI的《中国学术文献网络出版总库》和《中国引文数据库》,对上海市10所211高校图书馆(2007—2016)发表的论文,分别从论文年代、论文类型、图书情报学核心期刊发表论文、高
大成编客是CNKI旗下的内容汇编创作、作品展示与服务平台,是通过“编创出版+知识服务”的模式,对CNKI海量文献资源的开发利用。文章介绍了大成编客与知网书的基本情况,怎样成为大
在高校图书馆学科专业服务中,学科专业OA电子期刊推送服务是一项重要的服务内容。本文论述了高校图书馆学科专业OA电子期刊推送服务资源的选择原则、推送服务资源选择的级别
本体作为领域知识的表示方法,已经成为语义Web的基础。本体通常由领域专家建立,用于表示领域中概念以及概念与概念之间的关系。但这也使得普通用户难以理解本体中描述的信息。
Web Services合成是Web Services技术的重要方面,能够按要求提供选择新的服务。本文首先提出了Web Services服务约束的分类描述,进而分析了Web Services服务合成中如何按照服务
探讨了某海量数据系统中实现统计分析的策略和方法,并结合某大型人口信息系统中联机分析处理技术的具体应用,提出了在数据仓库模式下统计分析系统通用的功能架构。文章还针对实
本文从改善CMM的实施和提高过程控制能力入手,给出一个基于复用的软件过程改进框架,该框架将复用技术应用于软件过程改进与控制中,将当前模型驱动的自顶向下的过程改进模式与度
随着以太网技术的迅速发展,基于以太网的链路层流量控制技术成为流量工程的一个重要组成部分,基于漏桶式流控的以太网带宽控制算法被应用于驻地网环境当中.考虑到互联网中长
针对当前产生式编程方法不能有效地应用于复杂软件系统(如信息系统)的开发,不能在分析和设计的层次上复用软件等问题,本文提出了一种基于特征精化的产生式编程方法,基本思想是首先使用特征模型(Feature Model)描述领域内的概念和特征,然后使用特征精化的方法将特征精化为基本特征,用基本特征和之间的关系说明特征是如何实现的,最后将基本特征映射为组件,根据系统的特征模型组装组件,构建整个软件系统。基于