Web搜索的网页更新检测算法研究

来源 :2009年西南地区网络与信息系统学术年会 | 被引量 : 0次 | 上传用户:lizhuyundao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络上信息的快速增长,搜索引擎的数据更新技术成为获取信息的一种有效方法。本文描述了搜索引擎的基本技术,讨论了搜索引擎在网页更新时的检测算法,提出了通过ICMPU算法来检测页面是否有更新。该算法通过分析网页HTML标签提取的网页中心内容是否改变、网页图像是否改变来确定网页是否需要重新下载。
其他文献
虽然H.264视频编码标准具有很多以前视頻编码标准无法比拟的新优点,但是其编码器却相当复杂,在实时视频编码领域中这种复杂性严重阻碍了H.264的应用。为了降低其复杂性,通过对帧
骨架是一种非常重要的图像特征,本文提出了一种对N*N大小的二值图时间复杂度为O(N2)的细化算法。首先用距离变换将二值图各点排序,然后按此结果顺序删除非安全点。非安全点判断
在FDM算法基础上,提出一种改进的并行关联规则挖掘算法FDM_DT,该算法利用Hash表技术改进了2阶侯选项集的生成过程;并采用AprioriTid算法中的Tid表技术对交易数据库中的交易项数
“人们往往把一个人的顺利归结于表面看到的幸运,却忽略了顺利的背后那一份努力和坚持。”台湾作家林文月在她的散文中写道。 “People often attribute a person’s well-b
在总结了当前国內外多媒体检索领域中最活跃的图像检索和视频检索的研究现状后,本文提出和实现了一个面向多媒体信息的多模态检索系统,并结合SVM支持向量机相关反馈算法对图像
提出了一种基于分级最大熵模型的中文实体名识别方法。首先在第一级最大熵模型中完成无嵌套的实体名的识别,然后再在第二级最大熵模型中完成复杂地名和机构名的识别。该模型的
指纹图像中的奇异点携带着重要的指纹特征信息。由于拱型指纹图像中没有奇异点,Poincare Index方法就会拒绝登记该指纹,然而该指纹也可能是合格指纹,我们可以找出拱型指纹中相应
k近邻搜索是在d维空间n个数据点中,搜索给定查询点的k个最近邻居。针对k最近邻搜索算法存在的问题,提出了一种自适应的基于P2P的k最近邻搜索算法P2PAKNNS。探讨了度量空间、相
该文提出了一种基于文本挖掘技术的网络舆情监控方法。通过爬虫获取论坛、博客上的舆情信息,主动发现热点,并以XML格式存储为文本文件。采用特征提取的方法处理文本信息,分析话
随着因特网在全球范围內的飞速发展,网络媒体已成为十分重要的媒体。及时准确地掌握网络舆论,正确利用网络舆论对社会发展及有关事态的进展产生的正面影响,尽量避免或减轻其负面