基于视觉特征和领域本体的Web信息抽取

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:aacpc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决网页信息的自动抽取,该文提出了一种基于视觉特征和领域本体的Web信息抽取算法。该算法以基于领域本体的信息抽取为基础,根据网页的视觉特征来准确划定信息抽取区域,然后结合DOM树技术和抽取路径的启发式学习,获得Web页面中信息项的抽取路径。通过信息项的抽取路径自动生成信息项的领域本体,通过信息项的领域本体解析出信息项的抽取规则。使用本算法来进行Web信息的抽取,具有查全率与查准率高、时间复杂度低、用户负担较轻和自动化程度高的特点。
其他文献
随着无线通讯技术的发展,无线局域网的出现给Intemet的应用带来了革命性的变化。IEEE802.11技术的发展,导致大规模部署WIAN网络已成为~种必然趋势,分布式管理和集中式管理的WLAN网
研究节点动态不同的两个复杂网络的外部同步问题。运用牵制控制方法,网络模型选取节点输出线性耦合模型,基于输出控制思想,设计结构简单的牵制控制器,对响应网络中的部分节点施加
先进音频编码(AdvancedAudioCoding,AAC)以其多声道、多采样率、高压缩比、音质好等特点被广泛使用。文中首先介绍了MPEG-2/4AAC音频编码技术;接着基于MPEG-2/4AAC音频编码原理,开发
随着网络日新月异的变化,为了进一步保障校园网的安全,规范和审计师生的上网行为,保证学校对上网人员的可控性,文中研究了计费网关系统及目前计费网关系统在校园网出口的实现
针对虚拟社区中成员身份不真实、成员之间关系模糊、社团结构禾知的特点.提出基于空间和时间对虚拟社区进行社团划分的两种算法,最终在线了社团内部成员之间的交互关系和社团之
视频流传输控制对于提高网络服务质量具有重要意义。分析了MPEG视频流编码和传输特性,通过引入流间优先级和流内优先级机制,提出了一种基于优先级区分的视频流传输控制算法(PD
针对当前基于信息增益和粗集属性约简作为属性选择标准建树算法存在的不足,以粒划分方法为理论基础,将属性按其取值划分为若干属性粒,提出以属性粒的长度量和其所对应决策属性的
为了更好地解决在机器学习和数据挖掘等领域中经常遇到的两个概率密度函数的比值估计问题,文中提出了一种新的概率密度比值估计算法。该算法基于Kullback-Leibler距离,综合混
针对基本粒子群算法在求解火力打击体系目标分配问题时易陷入局部极值、计算精度差的局限性,提出了一种基于混沌粒子群算法(ChaosParticleSwarmOptimization,CPSO)的目标分配优化
为了挖掘隐藏在惯性仪器测试数据背后的信息知识,解决数据丰富而知识贫乏的问题,运用数据挖掘技术筛选出典型的故障测试数据,借鉴CRISP—DM行业标准并以Clementinel2.0为平台进行