基于CPat-Tree的URL索引模型裁剪方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:play5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海量URL会造成网络内容过滤系统索引效率低下。该文提出一种基于CPat-Tree改进的URL分级信息存储模型的裁剪算法,通过键值相似度实现键聚类,直接对存储数组遍历以合并相似的叶子节点,减少索引占用空间,提高查询效率。该方法裁剪前后的存储空间变化效果取决于键相似度,因此其具有良好的扩展性。
其他文献
行政单位在规范财务运行过程中,建立的内控制度可以确保行政单位经济活动的规范化与合法性,避免舞弊或者腐败现象的出现。基于此,笔者从行政单位内控制度的不足之处入手,给出
针对AVS的编码结构,提出一种基于混沌理论的AVS视频加密算法,并集成到AVS编/解码器中。该算法采用实值混沌序列加密和置乱DCT非零系数来加密视频信息。采用3个标准视频序列进行
一、选题背景金融是现代经济的核心,我国金融体系目前又以银行间接信用为主,这就决定了银行业在我国国民经济体系中的重要地位。银行业改革的步伐和绩效,不仅直接关系到银行
数据存储接口(DSI)为存储系统提供一个GridFTP数据传输接口,实现对不同存储系统的支持,但是DSI开发相当复杂。该文提出一个可扩展的GridFTP数据存储接口框架,分离并实现DSI共有的
以拉格朗日法为基础,采用耦合离散元法(DEM)颗粒碰撞模型的稠密离散相模型(DDPM)对兆瓦级化学链燃烧放大系统中炭颗粒分离器进行数值模拟研究,探究其中载氧体(OC)/煤焦(Char)
各向异性扩散平滑去噪的主要特点是扩散方向的选择性与定向扩散能力,有效表征信号或图像的局部结构特征是各向异性扩散的基础,传统的梯度表示方法极易受到噪声干扰。该文在分析图像局部结构表征方式的基础上,定义一个图像的局部各向异性强度参数M,提出一个新的扩散方程。试验测试显示,新扩散模型相对于ALM模型与CAZ模型具有更好的噪声压制能力和定向扩散能力,信噪比分别提高了0.1dB~0.8dB和0.3dB~1.