标记树相关论文
互联网资源含有大量的有用信息,且其信息数量仍在以指数形式飞速增长,这为用户提供了一个极具价值的信息源。但是因为互联网信息的......
本文针对HTML文档的信息抽取问题,提出了一种数据抽取的方法,该方法采用HTML树作为文档表示模型,边标记树作为文档的语义模型,对抽......
Web页面的布局可以分为:主要内容、单位标识、导航信息、交互信息和版权申明.我们在处理这些页面时往往只关心主要内容,而且可以从......
依据信息系统等级保护以及网络化系统整体安全保障的要求,建立一个网络环境下全程一致的强制访问控制机制是至关重要的。针对网络......
XML模式验证作为处理XML数据的前提和保证有着重要的地位,XML Schema作为XML的定义语言,其本身并不能保证XML数据的有效性。利用XM......
文中提出一种用于描述网页结构化信息的数据模型———区域树模型和一种便于计算机处理 ,表示网页信息中间数据结构———标记树。......
针对HTML网页版面中区域的形成及特点进行了分析,研究了网页版面中区域构成,相互关系等区域信息的分析和表示的方法,提出了一个便......
对信息抽取技术的发展和趋势作了一定分析,并讨论了当前半结构化信息检索领域的先进抽取技术。从应用的角度提出一种新的半结构化信......
对JPEG2000中T2编码器的率失真优化算法和码流组织方法进行了深入分析,提出了一种易于硬件实现的T2编码器快速算法并详细给出了其......
目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息,大量的HiddenWeb信息(估计容量是可索引Web的500......
根据Web页面标记建立标记树,通过分析,保留有用信息的标记子树,达到获取页面主要内容,净化页面的效果.......