扩展标记图相关论文
人们现在可以从万维网中获得各种各样的信息,但是这些信息都是高度分散、结构各异的。Web数据的这一特点使得网站的管理者花费大量......
大量的Web信息资源采用HTML文档形式存放,带来诸多不利因素.其一,HTML文档因包含具体数据内容,不可避免地会涉及到数据冗余和一致......
本文介绍一种基于扩展标记图[1]ETG(Extended Tag Graph)的网页信息抽取与重组新技术,引入了扩展标记图操作和重构概念,提出了作为......
介绍了一种新的Web信息抽取器,该抽取器基于扩展标记图模型,实现了数据和模式的分离,应用于Web检索系统中,能够有效地支持标记级实......