用N-连字算法实现网页的相似度比较

来源 :现代计算机:下半月版 | 被引量 : 0次 | 上传用户:walkonair
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出并实现了一种N-连字算法.用该算法可以较好地实现网页的相似度比较,用本算法来实现网页的“去重”.效果尤为明显。
其他文献
介绍基于CPLD的图像显示系统的设计方法。由于是对人机界面的图像显示,利用可编程器件CPLD设计,能满足用户需要,系统设计不复杂,性价比高。
草莓新害虫花弄蝶胡淼,胡春林(江苏省赣榆县植保站222100)(南京农业大学植保系)花弄蝶PyrgusmaculatusBremeretGrey属鳞翅目蝶亚目Rhopalocera弄蝶科Hesperi-idae。1988年作者首先发现于江苏句容和南京...
Web服务为软件系统间的互操作和应用系统集成提供了技术规范。分析Web服务的技术特性和目前的Web服务开发方式存在的不足,提出了用Web服务接口文档为依据开发标准化Web服务的
目的:观察氧化电位酸化水(Electroyzed Oxidizing Eater,EOW)对铜绿假单胞菌的杀灭效果及L型抗性诱导情况.方法:采用E0W原液及稀释液对铜绿假单胞菌的悬液杀灭实验、血清干扰
设计一个网络考试系统,其体系结构划分为3个层次:表示层、应用服务层和数据层,对网络考试系统的功能与运行模式、系统特点进行了详细讨论。系统能充分利用微软Smart Client和.NET
金融是现代经济的核心,在市场经济条件下,金融支持犹如“启动器”和“助推剂”,对经济发展的推动作用致关重要。从这个意义上讲,欠发达县域经济的发展对金融的依赖程度更高。但由
目的:探讨双腔右心室(DCRV)的超声心动图特点及误诊原因.方法:总结自1994年5月至2002年6月间经手术证实为DCRV患者13例的病例资料,分析DCRV超声诊断的特点,并与手术结果对比.
在贝叶斯过滤技术的启发下,选择数据挖掘的方法来研究一种具有学习能力的邮件过滤技术。通过对电子邮件的分析和研究,提出对邮件结构字段信息和邮件正文信息加以离散和特征化处
(一)来自储蓄存款的影响。储蓄是人们最原始的理财方式,具有稳妥、方便、灵活的特点,目前仍是城乡居民首要的投资渠道。银行存款和国债销售量存在“此长彼消”的关系,因受利益驱动
超文体(Hypertext/Hypermedia)是一种基于多介质的信息管理技术,VCR是一种拓展传统的数的换算与表示的方法。介绍超文体技术的发展、VCR的智能特性和VCN的计算公式,讨论VCR智能技