论文部分内容阅读
在Internet上有海量的数据,并且Web数据所具有的半结构化特性使得Web数据挖掘更加复杂,已有的一些Web数据挖掘技术难以很好地解决这些问题。而XML语言既可以作为一种中间数据格式,又可以用来定义一致的数据结构,为Web数据挖掘提供了一种新的解决方法。本文分析了XML文档的数据结构,提出了一种对原始HTML文档进行分析并转换成XML文档的Web数据挖掘模式。