论文部分内容阅读
网络挖掘大体有三类:网络内容挖掘、网络结构挖掘和网络使用挖掘。网络内容挖掘是指从Web上的文件内容及其描述信息中获取潜在、有价值的知识或模式的过程;网络结构挖掘是从WWW的组织结构的链接关系中推导知识,主要是通过对web站点的结构进行归纳、分析和变形将Web页面进行分类,以利于信息搜索;网络使用挖掘就是对用户访问web时在服务器留下的访问记录进行挖掘,所以也叫WEB使用挖掘,本文讨论了网络挖掘的数据采集技术、预处理技术及模式发现技术,并结合实际探索科技情报服务的新模式。