论文部分内容阅读
介绍了VI—DE,数据抽取工具DE-Wrapper的可视化编辑调试环境。DE—Wrapper使用扩展正则表达式(ERE)描述数据源结构,根据陵ERE构造数据抽取树(DE-树),然后根据DE-树生成相应的关系数据库模式,最后抽取数据。VI-DE整合了DE-Wrapper的工作流程。该工具首先使用可视化界面支持ERE/DE-树可视化构建,然后自动检查该ERE/DE.树是否具有二义性,最后在样本数据七运行抽取算法并给出数据库结构和抽取结果,供用户进行评价,从而逐步引导用户设计出满足要求的ERE/DE-树。VI—