基于隐私保护的序列模式挖掘

来源 :计算机科学 | 被引量 : 0次 | 上传用户:Tengshuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐私保护是当前数据挖掘领域的一个研究热点,其目标是在不暴露原始数据信息的前提下准确地实现挖掘任务。针对隐私保护序列模式挖掘问题,提出了项集的布尔集合关系概念,设计了基于随机集和扰乱函数对原始序列库进行数据干扰的方法模型,并通过扰乱函数的特性还原出原始序列库的频繁序列模式的真实支持度,完成了在保护原始数据隐私的前提下准确地挖掘出频繁序列模式的任务。理论分析和实验结果表明,该方法模型具有很好的数据隐私保护性、挖掘结果准确性和算法执行高效性。
其他文献
逆P-集合是具有动态特性的集合模型,逆P-集合的动态特性来自集合内元素(属性)的动态迁移:元素迁入使得集合的边界向外扩展,元素迁出使得集合的边界向内收缩,从而产生扰动的边界
传统的深度置信网络(DBNs)训练过程采用重构误差作为RBM网络的评价指标,它能在一定程度上反映网络对训练样本的似然度,但它并不是可靠的。而最大信息系数(MIC)能反映两个属性间的相关度,保留相关度较大的属性,且MIC较稳健,不易受异常值的影响,可作为网络评价指标。故提出一种基于最大信息系数(MIC)的深度置信网络方法,一方面用MIC对数据进行降维预处理,提高数据与网络的拟合度,降低网络分类误差;
微博是一种社交网络服务,它主要基于用户的关注关系进行信息分享和传播,具有时效性强、传播迅速等特点。将微博看成是反映城市动态的一类感知器,从识别微博的主题入手,检测微
提出一种基于DOM节点类型标注的网页主题信息抽取的方法。首先依据网页中噪声存在的形式,将DOM节点划分为4种类型:文本型、图片型、链接型和可忽略型,并给出节点内聚度的计算
非平衡数据中样本数量的不平衡分布往往伴随着特征分布的不平衡,在多数类文本中经常出现的特征,在少数类中却很少出现。针对非平衡数据特征分布的特点,提出了一种新的双边fis
针对现有多目标算法存在的收敛性不强、分散性不高等问题,提出了一种基于直觉模糊熵的粒子群多目标优化算法(IFEMOPSO)。首先,计算出种群的直觉模糊熵(IFE),作为衡量种群在多目标空间下多样性的测度;其次,设计基于IFE的惯性权重动态变化、外部档案调用以及变异操作等3种增强算法探索力度的策略,建立了直觉模糊多目标规划模型,有效地提高了群体进化过程中的多样性,防止了算法陷入局部收敛;最后,仿真结果
采集2015年十大网络集群事件热点之一的PM事件作为数据样本,通过对整个事件中起到关键传播作用的30个媒体集群及其相互关系进行研究,首先分析了在此类网络集群事件中具有关联性
近年来,统计模型检测技术已经得到了广泛的应用,不同的统计算法对统计模型检测的性能有所影响。主要对比不同统计算法对统计模型检测的时间开销影响,从而分析算法的适用环境
针对粒子滤波的重要性密度函数选择问题,提出一种基于集合卡尔曼滤波(Ensemble Kalman Filter,EnKF)的改进粒子滤波算法。该方法利用集合卡尔曼滤波产生粒子滤波在每一时刻各粒子
针对当前风电场有功出力的研究多侧重于理论方面,缺少具体软件平台的实现,开发了基于VC++与SQL Server数据库的风电场有功出力仿真软件平台。首先,利用VC++丰富的函数库对风电场