论文部分内容阅读
随着云计算的高速发展,用户对计算和存储资源的需求与日俱增,使得其越来越趋向于将自身的数据和计算任务外包给远程云服务器,从而摆脱复杂的本地数据管理和昂贵的计算开销。由于本地数据通常包含金融交易、医疗记录、地理位置等敏感信息,用户通常选择将数据先加密再外包发送给云服务器。然而,采用加密再外包的方式极大阻碍了外包数据的有效使用,无法发挥其潜在效用为用户提供更加友好的服务。另一方面,近年来机器学习在各大领域的应用取得了巨大成功。将复杂的机器学习任务外包给云服务器对计算资源匮乏的用户而言具有极大吸引力,可为用户带来极大便利。因此,本文将深入探讨如何实现在不泄露用户隐私数据的前提下,将机器学习计算过程外包给云使其高效完成指定计算任务。本文将机器学习分为三个阶段——特征提取,模型训练和模型应用,然后以各个阶段为突破口,分别选取典型的算法或应用场景,提出相应的安全外包计算解决方案。本文第一部分首先提出了支持隐私保护的特征提取外包计算方案。针对两大主流特征提取算法——尺度不变特征变换算法和稳定加速特征算法,本文利用混淆电路和类同态加密等技术分别提出了对应的安全外包计算方法,在保证图像数据隐私内容不被泄露的前提下最大化保留特征描述符的诸多关键性质。本文的第二个部分深入研究了两个经典的模型训练方法——岭回归分析和典型相关分析。我们利用Paillier加密技术设计了一套基础运算库以实现加密实数上的各种基础算术运算。基于此,我们提出了两个新的方案分别实现加密数据上的岭回归分析和典型相关分析,在保护数据隐私的前提下尽可能提高模型的精确度。本文的第三部分以生物特征识别为场景,重点研究了针对模型应用的安全外包计算方法。为了实现支持隐私保护的生物特征识别外包计算,我们利用多种矩阵变换、类同态加密等技术提出了两种拥有不同安全级别的方案,很好地实现了安全性与效率之间的平衡。