基于隐私保护的序列模式挖掘

来源 :计算机科学 | 被引量 : 0次 | 上传用户：Tengshuo

【摘要】

：

隐私保护是当前数据挖掘领域的一个研究热点，其目标是在不暴露原始数据信息的前提下准确地实现挖掘任务。针对隐私保护序列模式挖掘问题，提出了项集的布尔集合关系概念，设计了基

【作者】

：

方炜炜谢伟黄宏博夏红科

【机构】

：

北京信息科技大学计算中心,清华大学经济管理学院

【出处】

：

计算机科学

【发表日期】

：

2016年12期

【关键词】

：

序列模式数据挖掘隐私保护数据干扰 Sequential pattern Data mining Privacy preserving Data pe

【基金项目】

：

本文受国家自然科学基金重点项目（60675030）,国家自然科学基金项目（60875029）,2015年北京市委组织部优秀人才培养项目,2016年北京教育委员会科技面上项目资助.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

隐私保护是当前数据挖掘领域的一个研究热点，其目标是在不暴露原始数据信息的前提下准确地实现挖掘任务。针对隐私保护序列模式挖掘问题，提出了项集的布尔集合关系概念，设计了基于随机集和扰乱函数对原始序列库进行数据干扰的方法模型，并通过扰乱函数的特性还原出原始序列库的频繁序列模式的真实支持度，完成了在保护原始数据隐私的前提下准确地挖掘出频繁序列模式的任务。理论分析和实验结果表明，该方法模型具有很好的数据隐私保护性、挖掘结果准确性和算法执行高效性。

其他文献

逆P-集合的边界特征与系统状态监测

逆P-集合是具有动态特性的集合模型,逆P-集合的动态特性来自集合内元素（属性）的动态迁移：元素迁入使得集合的边界向外扩展,元素迁出使得集合的边界向内收缩,从而产生扰动的边界

期刊

逆P-集合元素迁移边界核扰动定理Inverse P -sets Element transfer Boundary Core Perturba

基于MIC的深度置信网络研究

传统的深度置信网络(DBNs)训练过程采用重构误差作为RBM网络的评价指标,它能在一定程度上反映网络对训练样本的似然度,但它并不是可靠的。而最大信息系数(MIC)能反映两个属性间的相关度,保留相关度较大的属性,且MIC较稳健,不易受异常值的影响,可作为网络评价指标。故提出一种基于最大信息系数(MIC)的深度置信网络方法,一方面用MIC对数据进行降维预处理,提高数据与网络的拟合度,降低网络分类误差;

期刊

深度置信网络最大信息系数重构误差降维DBNsMICReconstruction errorDimensionality reduction

基于微博的时空事件识别研究

微博是一种社交网络服务,它主要基于用户的关注关系进行信息分享和传播,具有时效性强、传播迅速等特点。将微博看成是反映城市动态的一类感知器,从识别微博的主题入手,检测微

期刊

微博时空事件主题模型Microblogs Spatial-temporal events Topic model

基于节点类型标注的网页主题信息抽取方法

提出一种基于DOM节点类型标注的网页主题信息抽取的方法。首先依据网页中噪声存在的形式,将DOM节点划分为4种类型:文本型、图片型、链接型和可忽略型,并给出节点内聚度的计算

期刊

DOM节点类型标注主题信息抽取DOMNode type annotationInformational content extraction

面向非平衡文本情感分类的TSF特征选择方法

非平衡数据中样本数量的不平衡分布往往伴随着特征分布的不平衡,在多数类文本中经常出现的特征,在少数类中却很少出现。针对非平衡数据特征分布的特点,提出了一种新的双边fis

期刊

非平衡文本情感分类正负相关特征双边特征选择Imbalanced Text sentiment classification Positive and

基于直觉模糊熵的粒子群多目标优化

针对现有多目标算法存在的收敛性不强、分散性不高等问题,提出了一种基于直觉模糊熵的粒子群多目标优化算法(IFEMOPSO)。首先,计算出种群的直觉模糊熵(IFE),作为衡量种群在多目标空间下多样性的测度;其次,设计基于IFE的惯性权重动态变化、外部档案调用以及变异操作等3种增强算法探索力度的策略,建立了直觉模糊多目标规划模型,有效地提高了群体进化过程中的多样性,防止了算法陷入局部收敛;最后,仿真结果

期刊

直觉模糊熵粒子群算法多样性多目标优化问题Intuitionistic fuzzy entropy Particle swarm optimizatio

复杂网络集群中的行为取证研究

采集2015年十大网络集群事件热点之一的PM事件作为数据样本，通过对整个事件中起到关键传播作用的30个媒体集群及其相互关系进行研究，首先分析了在此类网络集群事件中具有关联性

期刊

网络集群社会计算复杂网络网络集群行为关键节点&路径Network cluster Social computingComplex netw

统计算法选择对统计模型检测效率的影响分析

近年来,统计模型检测技术已经得到了广泛的应用,不同的统计算法对统计模型检测的性能有所影响。主要对比不同统计算法对统计模型检测的时间开销影响,从而分析算法的适用环境

期刊

统计模型检测统计算法无线局域网协议哲学家问题PLASMAStatistical model checkingStatistical algorit

一种改进的粒子滤波算法及其在GPS／DR组合定位中的应用

针对粒子滤波的重要性密度函数选择问题，提出一种基于集合卡尔曼滤波（Ensemble Kalman Filter，EnKF）的改进粒子滤波算法。该方法利用集合卡尔曼滤波产生粒子滤波在每一时刻各粒子

期刊

粒子滤波重要性密度函数集合卡尔曼滤波组合定位系统Particle filter Importance density function Ensemb

基于VC＋＋与SQL Server数据库的风电场有功出力的仿真软件实现

针对当前风电场有功出力的研究多侧重于理论方面,缺少具体软件平台的实现,开发了基于VC＋＋与SQL Server数据库的风电场有功出力仿真软件平台。首先,利用VC＋＋丰富的函数库对风电场

期刊

VC++SQLSERVER数据库微软基础类库(MFC)风电场有功出力VC＋＋ SQL server database Microsoft fou

基于隐私保护的序列模式挖掘

与本文相关的学术论文