基于HTML和XML的信息提取方法研究

来源 :微机发展 | 被引量 : 0次 | 上传用户：qy313

【摘要】

：

Web作为巨大的数据源，从Web中提取知识是当前信息研究的热点之一。主要研究针对HTML和XML页面如何生成Wrapper程序以便能够自动地从特定网页中提取有用信息，并成为将来进行Web

【作者】

：

【机构】

：

安徽农业大学信息与计算机学院

【出处】

：

微机发展

【发表日期】

：

2003年a02期

【关键词】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Web作为巨大的数据源，从Web中提取知识是当前信息研究的热点之一。主要研究针对HTML和XML页面如何生成Wrapper程序以便能够自动地从特定网页中提取有用信息，并成为将来进行Web挖掘的基础。

其他文献

期刊

目的研究p16、p15蛋白及增殖细胞核抗原（proliferating cell nuclear antigen,PCNA）在子宫颈癌中的表达特点,并探讨其与病理分级的关系。方法应用免疫组织化学ElivisionTM二步

期刊

提出一种基于二次逼近模型的PID增益预测控制,并阐述了该系统的结构、算法和应用特点.通过二次逼近建模的方法,提高了建模的算法速度和实际逼近精度以及较强的动态补偿能力.

期刊

目的探讨股骨头坏死（FHN）区域夹角/面积的比值在预测非创伤性缺血性股骨头坏死患者出现股骨头塌陷的敏感度及特异度。方法收集31例37髋FHN患者进行长期随访,测量其坏死面积及夹

期刊