基于XML技术的WEB信息收集方法研究

来源 :电子技术与软件工程 | 被引量 : 0次 | 上传用户:denny322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可扩展标记语言XML技术的出现,为Web的信息抽取和应用提供强有力的支持。我们可以把页面文档解析成DOM树的结构,对页面的操作转化为对DOM树的处理,然后采用XPath路径表达式定位DOM树中节点;XSLT是XML文档的转换语言,有了它我们可以对已知XML文档编写抽取规则,实现XML文档与Web页面的转换。本文结合XML技术优势实现对Web网页的信息抽取,构建了一个基于XML的Web信息抽取系统,提出了基于最小DOM树的信息定位方法。
其他文献
本文介绍了一种成本相对较低,实现简单,扩展容易的音乐频谱显示。所谓音乐频谱显示是指通过硬件或软件的方法,随着音乐强弱和节奏的变化,将音频信号中每个频率成分的幅值信息
为了解决目前智能手机中位置服务LBS(Location Based Service)类移动应用在小环境区域不能准确提供位置服务的问题,以校园为例提出了一种基于室内外定位的LBS系统设计方案。
本文以春秋战国时期的铭文语料作为研究对象,以专书研究的方法对其进行语法研究,着重对其中的句法进行梳理、分析,以期丰富和加强春秋战国铭文明显薄弱的句法方面的研究,填补
传统知识蕴含着巨大的经济价值,传统知识的保护问题也逐渐走进了国内外学者的视线。是否需要修改现行的知识产权制度来更好的保护传统知识,学界争论不一。为了解在拥有大量传
轴瓦精镗工艺具有很高的尺寸精度,而且要求在批量连续加工时有很好的稳定性。如何设计一套数控系统以满足这些要求,是本文研究的主要内容。本文研究了轴瓦精镗数控机床的组成
促进社会公平的实现是社会保障制度的天然追求,也是社会保障彰显其正义性的主要方面。但是由于种种原因,当前我国的社会保障制度无论在理念设计上,还是在实践操作中,都与社会
洞经音乐有其深刻的文化内涵,是中国传统音乐文化的活化石,洞经音乐的点点滴滴都渗透着丰富的历史文化信息。笔者多次来到四川、云南洞经音乐繁盛之地调研后发现,两省洞经音
为了设计一款具有自动温控和自动加湿功能的智能的风扇,本文使用STC12C5A60S2单片机为主控制器,单片机根据温度传感器测量到的实际温度,自动控制电机驱动模块的输出来调节电
采用高精度微地震监测技术,研究了微震事件的动态发展规律和分布规律,结合岩石力学和矿山压力与岩层运动理论,推断得到了特厚煤层综放工作面顶板岩层运动规律.随工作面的推进
本文以人力资源管理为核心,简要介绍了SAP系统及SAP-HR系统在人力资源管理中的应用意义,然后对SAP-HR系统在人力资源管理中的应用需求进行了归纳与总结,最后从核心、战略、分