基于树比较的Web页面主题信息抽取

来源 :微型机与应用 | 被引量 : 0次 | 上传用户：qweasd123qweqwe

【摘要】

：

为了从具有海量信息的Internet上自动抽取Web页面的信息，提出了一种基于树比较的Web页面主题信息抽取方法。通过目标页面与其相似页面所构建的树之间的比较，简化了目标页面，并在

【作者】

：

朱梦麟李光耀周毅敏

【机构】

：

同济大学电子与信息工程学院

【出处】

：

微型机与应用

【发表日期】

：

2011年19期

【关键词】

：

信息抽取相似页面树比较抽取规则 information extraction similar pages tree comparison extra

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了从具有海量信息的Internet上自动抽取Web页面的信息，提出了一种基于树比较的Web页面主题信息抽取方法。通过目标页面与其相似页面所构建的树之间的比较，简化了目标页面，并在此基础上生成抽取规则，完成了页面主题信息的抽取。对国内主要的一些网站页面进行的抽取检测表明，该方法可以准确、有效地抽取Web页面的主题信息。

其他文献

面向数据密集应用的云计算服务架构

提出了一种具有云计算特点的可伸缩的服务器架构，通过采用模块化的方式有效地分割服务功能，能以对用户透明的方式满足三维网络应用的各种存储和带宽的需要。将该方案在一个三维

期刊

网络计算模型云计算客户/服务器模式三维虚拟现实network computing model cloud computing client/serv

东北边疆·民族与社会——辽西走廊文化遗产保护研究

辽西走廊文化遗产数量多，分布广，特色鲜明。这些文化遗产包含着丰富的科学、文化、历史、艺术和经济价值，是历代人民劳动与创造的产物，反映了辽西走廊独特的地域文化和精神传统。

期刊

辽西走廊文化遗产保护Western Liaoning Corridorcultural heritageprotection

谈企业破产中银行债权保护

从1993年到1995年的两年时间里,江苏省通过法院正式宣布破产的企业共有33家。为了了解企业破产过程中出现的问题及由此引起的银行贷款损失情况,我们重点调查了四家企业,连云

期刊

银行债权保护企业破产连云港资产负债率抵押物价值电瓷东海县破产企业职工安置费抵押人

基于GPRS自动抄表系统的设计与实现

介绍了一种基于GPRS自动抄表系统的解决方案，详细阐述了系统组成的层次结构、模块设计和实现方法，并对系统实现的功能进行了阐述。该方案实现了实时抄表、定时抄表、电费管理和

期刊

GPRS网络自动抄表模块设计电费管理GPRS Network automatic meter reading module design

移动自组网中多级安全事务的并发控制

为满足移动自组网（MANETS）多级事务处理的安全性和并发性要求,将多版本两段锁协议运用到MANETS多级事务中。该协议有效地解决了由于竞争产生的错误的事务调度以及安全问题。模

期刊

MANET多级安全并发控制多级事务MANET multilevel secure concurrency control multilevel t

论文化资本

一、引言在经济学中，我们习惯于区分三种形式的资本。首先是物赁资本，它意味着真实商品的存量，如工厂、机器、楼房等，可以用来生产进一步的商品。在经济学刚刚起步时人们就知道

期刊

文化资本经济学家物质资本资本存量人力资本经济生产环境问题经济活动

私有化能否改善环境？

过去的二十年中，私有化已经成为一个全球性的现象。私有化对产出、效率和福利的影响也已经在文献中得到广泛的研究。从包括利润和消费者剩余的社会福利来看，公众持有企业的生产

期刊

私有化利润最大化社会福利消费者剩余有效率全球性

论大型组织中的信任问题

近来的一些研究,包括达戈·加尔塔(1988)以及吉姆斯·科尔曼(1990)、罗伯特·普特南(1993)、福山·弗兰西(1995)的研究,都主张信任或社会资本决定了一个社会

期刊

社会资本信任问题囚徒困境绩效合作罗伯特公共机构科尔曼社交组织

“锦州苹果”廉政文化进校园的几点思考

研究借鉴我国反腐倡廉的历史文化,从中收获史上反腐倡廉得失成败的经验教训,撷取优秀的智慧为今所用,这对于加强新形势下党风廉政建设,将具有积极的推动作用。本文试图从＂锦州

期刊

廉政文化锦州苹果廉洁自律

对外贸易与国内地理布局

在这本书（指《空间经济：城市、区域和国际贸易》一书）中，我们将建立三种模型：一是区域模型，在此模型中工业制成品是可流动的而农产品是不可流动的：二是城市模型，在此模型中除了土地以

期刊

对外贸易城市模型地理国内国际贸易工业制成品空间经济农产品

基于树比较的Web页面主题信息抽取

与本文相关的学术论文