【摘 要】
:
随着信息时代中数据量的快速增长,传统的数据挖掘方法在处理大规模数据上已稍显不足。分布式数据挖掘应用越来越广泛。然而,在分布式环境中,信息的共享可能会泄露个人的敏感
论文部分内容阅读
随着信息时代中数据量的快速增长,传统的数据挖掘方法在处理大规模数据上已稍显不足。分布式数据挖掘应用越来越广泛。然而,在分布式环境中,信息的共享可能会泄露个人的敏感信息,增加隐私泄露的风险。隐私保护数据挖掘(Privacy Preserving Data Mining,PPDM)成为当前数据挖掘领域一个越来越重要的课题。本文提出了一个基于SVM分类器的隐私保护数据挖掘框架,即PPNL-SVM(Privacy Preserving No-Linear SVM)。该框架在能够保护数据隐私的同时对水平分布数据进行分类挖掘。具体来说,研究内容如下:(1)为了在分布式数据挖掘中保护数据隐私,保证分类精度和效率。本文提出一个隐私保护非线性SVM(PPNL-SVM)框架来构建PPDM的分类模型。在数据水平分布和安全多方计算的半诚实模型条件下,PPNL-SVM框架分为三层:底层使用安全求和协议和Paillier同态加密方案将通过k-means聚类算法选择出的数据中心点进行加密来保护数据的隐私。中间层使用Nystrom近似技术和矩阵分解技术来减少复杂的通信和计算。顶层使用切平面技术加速分类模型训练过程。PPNL-SVM框架不需要依赖于可信第三方,所有参与者平等合作。安全求和协议和Paillier同态加密方案能够保证框架的安全性,得到有效的分类挖掘结果。(2)针对SVM分类器主要对二类分类有效的局限性,本文将PPNL-SVM框架扩展到解决数据水平分布的多类分类问题。使用一对多的方案,将多类分类问题分解成多个二类分类问题。通过PPNL-SVM框架来实现二类分类。因为PPNL-SVM的安全性和效率是有保证的,所以,多类分类的安全性和效率也能得到保证。本文对提出的框架进行了验证,实验结果表明PPNL-SVM框架在分类挖掘过程中不仅能够有效地保护数据隐私,提高分类器的性能,而且也能有效地解决多类分类问题。
其他文献
著名的物理学家费曼曾经说过:“What I can’t not create,I do not understand”。系统创造事物的能力在一定程度上表明了系统理解事物的能力,因此,研究生成模型有望加深对认知技术的了解,从而推动人工智能技术的发展。生成模型是机器学习技术的重要一环,主要可以分为传统生成模型和以生成对抗网络为代表的现代生成模型。传统生成模型考虑了显式的密度估计,具有良好的理论解释,但
为了建设智能化、无人操作管理化的变电站,变电站逐渐采用机器人来代替人工进行工作。但现如今很多变电站对绝缘子清扫作业还是采用带电水冲洗设备或者进行人工擦洗。论文针对变电站支柱绝缘子,设计开发出一种新型的攀爬式清扫机器人。能够通过机器人的视觉识别,自动完成绝缘子的清扫作业。论文针对绝缘子识别问题与绝缘子污秽问题展开研究,系统地研究了变电站绝缘子清扫机器人整体结构、绝缘子伞裙边识别算法和绝缘子污秽分类等
互联网的高速发展,特别是Web2.0技术的突飞猛进,使得用户成为互联网的制造者和管理者。微博,作为一种新型的社交网络平台备受用户的青睐,日益走进了普通网民的生活。用户通过
目的:结合光学相干光断层扫描(OCT),对比多光谱成像技术(MSI)和眼底彩照在妊娠期高血压性视网膜病变中的诊断价值。方法:选取明确诊断的妊娠高血压疾病病人70人,共140只眼,平
合成孔径雷达(Synthetic Aperture Radar,SAR)是实现高分辨成像的雷达系统,SAR的高分辨特征主要是应用了脉冲压缩和合成孔径技术完成。合成孔径雷达的成像精度和质量受周围环
IEEE 802.11系列协议为了满足日益增长的无线数据传输需求,已经从802.11a/b/g/n演进到802.11ac,其中采用的一项重要技术为信道绑定(Channel Bonding,CB),通过允许绑定5G频段
目的:本研究采用中西医结合治疗的SLE全程管理模式对系统性红斑狼疮(SLE)患者进行全程慢病管理干预,通过对患者的疾病活动指数、中医生活质量、焦虑、抑郁情绪以及患者自我管理能力等相关指标的评估,初步探讨该管理模式的应用价值,为临床SLE治疗和慢病管理方案的选择提供参考。方法:本研究采用病例自身前后比较的方法,从广东省中医院皮肤科门诊连续性招募50例符合诊断标准和纳入标准的SLE患者,进行以中西医结
本课题针对常规钨极氩弧焊存在的单道焊接熔深浅、焊接速度低、焊接效率低下等问题研发了深熔钨极氩弧焊焊接方法(Large Penetration Tungsten Inert Gas Welding简称LP-TIG焊),该焊接方法是通过强化冷却钨极,压缩电弧,获得电流密度大、电弧挺度高、穿透能力强的焊接电弧,实现穿孔型焊接,增大焊接熔深,提高TIG焊的焊接效率,拓展常规TIG焊的应用范围。本文根据深熔
随着互联网技术的飞速发展,信息过载问题日趋明显,如何在海量信息中找到感兴趣的内容是互联网服务亟待解决的重要问题。个性化推荐系统是解决信息过载的常见手段,并且随着个
截止到2016年底,中国移动电话4G用户总数达到7.7亿户,占总用户数的58%。各运营商一方面要快速投入大量资金在城市、乡村建设覆盖更加广泛的全新4G网络,另一方面又要充分考虑