重复数据检测相关论文
随着互联网数据量呈现爆炸性增长,海量数据的存储和查询给数据中心带来了极大的挑战。MongoDB作为一种新型的非关系数据库,其灵活......
云存储正在因为它的可扩展性、方便性和低成本等诸多优点而变得越来越流行。它通过租用基本设施来提供对于文件的服务,包括允许用......
近几年互联网信息技术的飞速发展给个人、企业、政府部门以及社会的方方面面带来的极大的便利,大量的电子数据随之产生,数据在各个......
针对数据清洗过程中的重复数据问题,以企业名称的相似重复度检查为例,提出一种利用核心词相似计算的重复数据检测框架构建.通过对......
分析了当前主要的重复数据检测技术,针对多版本数据的备份/还原过程提出了重复数据检测三级模型,有效地解决了检测粒度和检测开销......
远程文件快速同步在文件备份与恢复、web与ftp网站镜像、内容分发网络、Web访问中具有广泛的应用。提出了一种高效的基于内容变长......
随着企业数据信息量的不断地增加,海量数据信息的存储和不断备份已经给企业的存储空间带来了巨大的存储压力;本文分析了当前主要的......
Rabin指纹算法计算效率高、随机性好,可将数据更改对连续指纹序列的影响限制在局部范围内,广泛应用于重复数据检测领域。分析了Rab......
追溯系统是为保证产品质量而建立的有效质量监督体系。近年来随着食品安全问题日益突出,以追溯系统为核心的质量监督体系得到了广......