论文部分内容阅读
针对云存储数据源分散、难于集中的特点,根据代理提取分类规则数与每个代理提取误差率以及整体提取误差率之间的关系,提出一种基于遗传算法的云存储分类规则提取方法。在代理端分布式提取分类规则后传输到中心数据库进行归并,从而达到分布式提取分类规则的目的,通过理论推导得出每个代理提取误差率和整体提取误差率的上限随着提取规则数的增加而递减。实验结果证明,在提取规则数足够多的情况下,分布式提取的回归准确率和集中式提取的回归准确率的差值趋于常数,保证了云存储分布式分类规则提取的可行性。