论文部分内容阅读
深网来源包含一大高质量;质问相关的结构化的日期。在深网的挑战之一正在提取深网来源的结果纲要。探讨这挑战,这篇论文描述提取两个结果数据的一条新奇途径;一个网数据库的结果纲要。途径首先为深网来源的询问接口建模;用填它一明确地质问例子。然后,深网来源的结果页在树结构被格式化检索包含质问例子的元素的子树。下次,深网来源的结果纲要被与质问例子匹配 subtree' 节点提取,在哪个,一个二阶段的纲要抽取方法为获得更多的精确结果纲要被采用。最后,真实的深网来源的实验显示出我们的途径的用途,它提供高精确;召回。