基于信息增益比例约束的数据匿名方法及其评估机制

来源 :计算机应用研究 | 被引量 : 5次 | 上传用户:znaddh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对数据发布中的隐私泄露问题,分析了对数据集进行匿名保护需要满足的条件,提出了一种基于信息增益比例约束的数据匿名方法。该方法以凝聚层次聚类为基本原理,将数据集中的元组划分到若干个等价群中,然后概化每个等价群中的元组使其具有相同的准标志符值。在聚类过程中,以信息损失最小、信息增益比例最大的约束条件来控制聚类的合并,可以使数据匿名结果保持良好的可用性和安全性。对匿名结果的质量评估问题进行了深入的探讨,提出了匿名结果可用性和安全性的量化计算方法。在UCI知识库提供的Adult数据集上的一系列实验结果表明,
其他文献
为解决先验概率作为重要性密度函数因未融入最新的观测信息而造成测量精度低的问题,提出了迭代容积粒子滤波。此算法采用Gauss-Newton迭代和容积卡尔曼滤波设计重要性密度函数,在迭代过程中不断修改新息的方差和协方差,使重要性密度函数更接近后验概率密度。此外,为确保状态协方差矩阵的正定性,采用了平方根滤波的思想,通过正交三角分解来代替每次迭代的矩阵开方操作。仿真实验证明,此算法可以提高滤波精度,适用
随着网络中部分路由器使用了负载均衡策略,发往同一目的端的数据包不再沿着单一路由转发,传统的拓扑测量工具Traceroute将难以发现网络中的负载均衡链路及节点,测量精度受到影响。多路径路由探测算法(MDA)在端到端网络拓扑测量中能够有效地发现负载均衡节点产生的多条路径,但探测量却是Traceroute的近10倍。提出一种改进的多路径路由探测算法,通过设置全局查找表,源主机能够自适应地选择探测策略以
与传统三维激光扫描仪相比,Kinect作为一种新型深度相机,具有价格低廉、深度数据获取能力强、RGB影像与深度影像同步获取等优势,然而面对较大室内场景精细建模却存在数据量大、建模范围有限、对硬件环境依赖性强等问题。因此,在现有单一模型建模基础上,提出了基于Kinect深度影像的多模型数据融合方法,实现模型间的自动拼接。最后通过两组实验对提出的数据融合方法进行了验证,并取得了较好的模型拼接效果。
由于追求收敛速度与防止陷入局部最优,标准的改进强度Pareto算法(SPEA2)过于注重全局搜索能力,从而导致局部搜索能力不足。为了增强SPEA2算法的局部搜索性能,进而提高算法收敛速度,提出了一种基于局部搜索的改进SPEA2算法。该算法单独设置一个新外部存档集以保存局部搜索后的非支配集,并且改进了交叉算子,加入了部分个体更新策略。将该改进算法与SPEA2算法进行了收敛性能比较实验。仿真实验结果表
针对硬件面积、价格成本、功耗、实时性和可靠性多目标优化的一类嵌入式系统软硬件划分问题,提出了一种采用多属性决策技术的求解方法。首先对可靠性指标进行了转换,通过改进的最短路径算法获得满足约束的Pareto方案集合;然后,采用基于组合权重的TOPSIS算法对多个划分方案进行评价排序,得到最优的多目标划分解;最后,通过一个实例验证了本方法的有效性和可行性。
提出了一种基于平均相关技术的快速精密的GPS信号C/A码捕获方案,该方案将接收到的中频信号和本地复制C/A码以高采样频率进行采样,然后通过对它们进行平均处理后以1 024点的FFT处理器计算相关能量值。与不经过平均处理的基于FFT的码捕获方案相比,该方案的运算复杂度约为1/22,可实现快速捕获的目的;与捕获精度为半个码片的常用码捕获方案相比,该方案的捕获灵敏度理论上提高约2.2 dB。最后通过仿真
为解决P2P网络中Chord算法众多节点性能不一、节点频繁离开和加入制约系统性能的问题,提出了基于信息相关度的分组改进算法。该算法通过引入节点信息相关度的概念,对原Chord进行信息相关度的一个分组调整。从每个组选出两个超级节点组成超级组,同时为每个节点增加了逆时针路由,在两个超级节点顺逆两个方向上选择出最短路径进行查找。实验表明,改进后的算法使得系统的性能和适应性都得到了加强,提高了Chord在
针对现有多目标元胞遗传算法存在邻居单一固定、不能适时变化的缺点,提出一种基于邻居自适应的多目标元胞遗传算法。该算法在经典多目标元胞遗传算法的基础上引入邻居自适应机制,动态调节邻居结构,使算法不断寻找全局搜索与局部寻优之间的平衡点。最后,与现有流行的其他多目标进化算法作比较,通过对不同类型的20种基准测试函数问题进行测试,证明该算法具有良好的收敛性和扩展性。
为了减小所生成的组合测试用例集规模,提出了一种基于one-test-at-a-time策略的差分进化算法来求解该问题的方案。通过实验,比较了不同变异方式的优化性能,考察了各个算法参数对优化性能的影响,并与其他常用方法进行了对比。实验结果表明,与其他常用的组合测试用例生成方法相比,基于差分进化算法的生成方法能够生成规模更小的组合测试用例集。并且组合数越多,该算法的优势就越明显。
特征选择是文本分类技术的一项关键技术,特征选择的质量决定了分类的性能。在分析现有特征选择方法的基础上,引入类词频概念,建立"文档—类—词"立方体。实验表明,这样的立方体模型能更全面、更客观刻画特征的本质,兼顾了特征的类内分散度更平均、类间集中度更集中。结合类词频选择的特征提高了文本分类能力。