网页结构相关论文
机器人流程自动化(RPA)是以软件机器人及人工智能为基础的业务过程自动化科技,能够代替或协助人类在计算机等设备中完成重复性工作。......
互联网的飞速发展使得其中的信息呈爆炸性增长,但互联网中的信息由于其本身的无结构性使人们很难找到自己有用的资源。如谷歌、百度......
随着WWW的迅猛发展,对网页进行分类成为处理和组织大量文档数据的关键技术。由于最大熵模型可以综合观察到的各种相关或不相关......
Internet的发展使得Web网页开发也获得了很大的发展。当网络技术和分布式计算技术逐渐发展并走向成熟时,Web网页开发也变得非常复......
信息技术的发展对全世界来说都产生了极大的影响,是当前高技术发展中的主流技术,因为信息在人类生活中无处不在,无时无刻的不影响着人......
网页结构相似性的度量是Web信息处理中的一项重要任务,在数据抽取和搜索引擎等研究领域有着潜在的重要研究价值。好的相似性度量方......
近些年随着互联网信息量的快速增长,如何准确、快速、高效地从互联网上获取信息的问题变得越来越突出,面向主题的聚焦爬虫技术应运......
如今,越来越多的用户通过手机浏览器来访问互联网上的信息和服务。传统互联网(WorldWideWeb,简写WEB)的内容是针对个人电脑终端(Pers......
随着互联网技术的飞速发展,不同领域网络信息的种类和组成形式愈加复杂,每个网站节点都具有复杂的分类体系结构,并且包含丰富的文......
为了方便人们的阅读习惯、网页的排版格局以及网站的商业目的,网页中往往充斥了许多与网页正文无关的内容,如导航条、相关链接和商业......
随着网络信息的爆炸性增长,传统的搜索引擎已经不能满足人们获取精确信息的需要,主题搜索应运而生,主题爬虫是其基础和关键性部分,直接......
中国的移动互联网经历了从无到有、从慢到快、从人工到智能、从单一到多元的发展阶段,移动互联网正不断地在向人们的生活中注入新......
在发展计算机辅助语言学习系统时,对学习者认知方法水平的评价是极其重要的。此研究的目的在于提出一个神经网络模式,该模式通过观察......
相似度计算是文本挖掘的基础,也是信息提取过程的关键步骤。对于结构复杂的网页,当前基于传统树路径模型的相似度计算方法在准确性......
随着Web编程技术的发展,同类主题网页可以采用不同的Html标签展示出视觉特征相同的网页信息,导致需要匹配Html标签名称的现有网页......
为了提高网页排序算法的准确率,从网络用户对网页的浏览、回复、转载等行为引入用户行为因子,从网页结构关系的角度解决网页的权威......
为测试网站的无障碍程度,需要测试网站中所有网页的无障碍性。对于大型网站,直接测试所有网页是耗时而昂贵的。在实践中,通常选择......
提出了一种基于搜索代理的自动提取和分析纺织企业信息的搜索系统.该搜索代理以搜索引擎技术为核心,结合用户反馈信息和专业领域词......
随着互联网技术发展,企业营销战场从实体店面转移到互联网上的平台,于是有很多企业开始委托他人或自建的方式搭建自己的企业网站,......
大多网页都是基于服务器端模板生成的,所以在同一个站点经常看到很多外观相同内容相似的网页。HTML是一种半结构化的标记语言,每个HT......
随着网络技术的快速发展以及网络服务的不断普及,网民对于网络的依赖性逐渐加强。网络技术的发展也导致各类特定网站的出现,使得网......
垂直搜索引擎需要对网页的内容进行提取,信息提取算法是研究的关键内容之一,文章提出一种新的基于行模式的索引网页的信息提取算法......
本文结合网页结构,充分考虑用户在网页的滞留时间和页面切换,基于Bayes概率提出了一种能挖掘出优良的用户兴趣迁移模式及感兴趣的......
该文提出将网页的结构特征提取出来,用于用户建模过程中。根据网页结构特征,人为提升部分词汇的词频权重,从而来建立用户模型。实......
本文针对已有命名实体识别算法在网页结构特征利用方面的问题,提出了基于网页结构特征的中文命名实体识别算法和实体关联算法。该算......
本研究以网络课程的教学内容呈现页面为实验材料,采用眼动追踪技术,探讨网页结构类型对我国大学生认知有效性的影响。在此基础上,......
眼动追踪技术为读者浏览网页的行为和模式提供了精准、详实的视觉特征参数依据,为解释和抽象读者的浏览行为可提供定性和定量分析,揭......
随着网络、多媒体技术的迅速发展,学生的学习方式发生了根本的变革,利用网络、多媒体学习已经成为信息时代主要的学习方式。以网页......
Web信息抽取技术一直是信息技术领域的研究热点。而且,近年来,DIV+CSS的网页布局方法开始普遍应用于网页设计中。基于此,提出了一种较......