论文部分内容阅读
针对当前很多企业面临的海量数据资产的治理问题,提出了一种基于数据智能分类技术的数据治理方法。首先通过数据智能分类技术对企业海量数据进行自动分类;然后应用关键词提取技术对每类数据进行关键词提取;最后结合专家判断确定每类数据中能够体现当前类别的关键词,并对其进行敏感度标记。该方法可以解决企业海量数据分类分级问题,发现企业的敏感数据。此外,通过对比实验结果表明相比于朴素贝叶斯(Nave Bayes),SVM算法在数据智能分类中有更好的效果。