基于XML的Web信息数据库的建立

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户：cyg858644

【摘要】

：

为了有效地从Web页面上提取数据信息，本文建立一种基于XML的Web信息收集数据库。利用开源工具JTidy将Web页面加以整理，利用XML良好的结构特性，使用Dora4j工具包解析XML文件；按照X

【作者】

：

黄昱阳李慧伦

【机构】

：

华南理工大学生物科学与工程学学院,山东理工大学生命科学院

【出处】

：

计算机与现代化

【发表日期】

：

2012年9期

【关键词】

：

XML WEB 信息挖掘数据库 XML Web data mining database

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了有效地从Web页面上提取数据信息，本文建立一种基于XML的Web信息收集数据库。利用开源工具JTidy将Web页面加以整理，利用XML良好的结构特性，使用Dora4j工具包解析XML文件；按照XML中的标签层次特点作为对数据进行储存的依据；最后使用Hibernate将数据持久化地储存于数据库中，方便数据的储存与查询。

其他文献

基于联合决策树的客户流失预测模型设计

为了解决电信行业客户流失预测模型中流失者和未流失者比例偏斜问题，模型依据数据挖掘原理，以CRISP-DM（Cross-industry Standard Process for Data Mining）建模过程为框架，采用了

期刊

客户流失预测决策树多基决策树联合决策数据挖掘customers churn prediction decision tree multi-class

基于小波的信号分析

简介小波概念之后,对一组模拟信号进行分析,采用小波变换,选出合适的小波函数,处理后再重构。对采用Mexican hat小波、Shannon小波、Meyer小波这三种不同小波得到的去噪结果

期刊

信号分析小波变换去噪分析signal analysis wavelet transform denoising analysis

基于嵌入式技术的脉搏信号测试系统

在基于Qt/Embedded软件界面的基础上,主要介绍编写S3C2410的A/D转换驱动和设计开发,最后在开发板上实现实时采集人体脉搏信号和显示脉搏波形。

期刊

A/D转换移植人体脉搏波A/D conversion transplantation pulse of human body

基于WLAN技术的交通道路监控方案

在论述道路监控系统发展现状的基础上,分析无线局域网（WLAN）技术的应用场合。通过研究对监控摄像机的基本要求,提出基于WLAN技术的道路监控方案,并探讨无线传输设备的频率选择

期刊

无线局域网道路监控无线传输网络带宽WLAN road monitoring wireless transmission network bandw

一类三角模的结构性分析

基于弱否定,对一类三角模进行结构性分析,给出一种三角模的构造方法。

期刊

信息聚合模糊逻辑三角模弱否定information fusion fuzzy logic triangular norms weak negati

一种盲信号分离算法的改进研究

盲信号分离在信号处理领域中逐渐变得重要起来，其为混合信号的分离提供一种较好的途径。独立分量分析是盲信号分离中的主流方法之一，其中的快速ICA算法更是具有分离效果好、收

期刊

盲信号ICA快速ICA目标函数blind signal ICA fast ICA objective function

基于不同背景噪声的联合检测技术

提出一种简单、实用的联合检测技术,将经典的基于能量和过零率的双门限法与基于小波变换的子带能量法巧妙地结合起来进行语音信号的端点检测,充分利用双门限法算法简单、实时

期刊

双门限法端点检测子带能量联合检测信噪比double-thresholds method endpoints detection subband e

求解曲面距离问题的模拟退火遗传算法

提出计算曲面距离的统一方法——退火遗传算法。该算法将模拟退火算法和遗传算法相结合,解决了曲面之间的距离问题。该方法将工业中常用的曲面统一用参数形式表示,利用遗传算

期刊

曲面距离BEZIER曲面NURBS曲面模拟退火遗传算法surface distance Bezier surface NURBS surface

连续数据保护中的滑动窗口技术的优化

连续数据保护技术是减少企业数据损毁的重要方法。由于每次需要对I/O进行备份，存储空间的容量成为限制CDP有效备份时间长度的主要因素。然而，对于大多数应用来说，其出现峰值写入

期刊

CDP滑动窗口空间利用率自动调整RPOCDP sliding window space utilization automatic adjust

P2P网络下信任模型研究

对等网络（Peer-to-Peer,P2P）中信任问题可以通过在系统中建立可靠的信任管理模型来解决。本文首先概述P2P网络及其面临的安全问题,然后对现有的典型P2P网络信任模型进行分析,并

期刊

对等网络信任信誉信任模型peer-to-peer networks trust credibility trust model

基于XML的Web信息数据库的建立

其他学术论文