论文部分内容阅读
数据挖掘是指从海量的数据中借助算法查找数据中潜在信息的过程。为了提高数据挖掘的准确性一方面需要对算法进行改进,另一方面需要在大量的数据上做数据挖掘,而这些数据一般来源于不同的单位或用户。由于本地存储和计算资源的限制,随着云计算的发展,越来越多的用户选择把数据上传到云上实现存储外包和计算外包。云是不完全可信的第三方,会使得用户对自己数据的拥有权和控制权分离,进而导致数据隐私信息泄露的风险产生。另外数据挖掘是一把“双刃剑”,直接在具有隐私信息的数据上做数据挖掘也会导致数据隐私信息泄露的风险产生。本文基于安全多方计算,提出了一种利用支持向量机算法在多用户的加密的数据上做具有隐私保护功能的数据挖掘方案。针对整数域上多用户加密数据的计算问题,本文提出了具有存储外包和计算外包功能的双云框架模型。设计了支持在多密钥加密的整数域上做加法和乘法计算的同态加和同态乘协议。该协议首先基于“盲化”技术对密文数据进行盲化处理,然后通过两个云之间的交互计算将多密钥加密的数据转为同一个单密钥加密的数据,最后利用单密钥同态协议的性质完成在密文上做加和乘的计算。针对有理数域上多用户加密数据的计算问题,本文沿用了在整数域上设计的双云框架。有理数包含整数和小数,而小数的加解密计算和存储不同于整数,本文首先通过将小数转为分数,然后分别对分子和分母利用整数域上设计的同态加和同态乘的协议进行计算,最后在多密钥加密的有理数域上完成加法和乘法的计算。基于本文设计的支持在密文上做加法和乘法的同态协议,可以利用支持向量机算法在多密钥加密的有理数域和整数域上做数据挖掘。在半诚实安全模型中可以证明在保证数据挖掘准确性的前提下,本文设计的算法可以保护用户的数据隐私、中间计算结果的隐私、分类模型的隐私和最后分类预测结果的隐私。本文基于设计的算法,搭建了利用支持向量机算法做具有隐私保护功能的数据挖掘系统,并在医疗环境中进行了应用示范。