论文部分内容阅读
自上世纪九十年代以来,隐私保护数据挖掘越来越受到学术界的重视,许多学者针对不同的数据挖掘任务中存在的数据信息泄露问题进行了研究,而隐私保护支持向量机研究是其中的一个重要方面。本文简要介绍了隐私保护数据挖掘和隐私保护支持向量机算法的研究成果,并针对支持向量机模型建立过程中存在的隐私保护问题,提出了新的隐私保护方法。本文主要研究结果如下。针对支持向量机模型建立需要直接访问数据,侵犯数据隐私的问题,首先借助正交旋转变换保护数据隐私,提出了一种新的基于正交变换的隐私保护支持向量机模型。在此基础上分别提出水平分布、垂直分布和棋盘格分布数据集上相应的算法,指出任意分布的数据情形可划分为棋盘格的分布形式,因而可采用其算法建立模型求解。标准支持向量机对偶模型建立的关键在于数据向量点积计算。安全点积协议是在不泄露数据信息的前提下,计算得到两个参与方数据点积。本文讨论了Ioannidis安全点积计算协议的安全性和正确性,并将该协议应用于支持向量机对偶模型求解,提出了水平分布数据集上的隐私保护支持向量机算法。