【摘 要】
:
在数据智能时代,机器学习技术在各行各业取得了爆发式的应用。训练一个机器学习模型需要海量的数据、服务器资源以及算法科学家的参与,具有一定的门槛,因此出现了机器学习推断服务:服务商将训练好的机器学习模型封装为一个接口,作为一项服务对外提供。任何人都可以提交自己的数据,获得相应的推断结果。机器学习推断服务的普及大大降低了机器学习的门槛,但在当前的机器学习推断服务系统中,客户需要将数据以明文形式直接提交给
论文部分内容阅读
在数据智能时代,机器学习技术在各行各业取得了爆发式的应用。训练一个机器学习模型需要海量的数据、服务器资源以及算法科学家的参与,具有一定的门槛,因此出现了机器学习推断服务:服务商将训练好的机器学习模型封装为一个接口,作为一项服务对外提供。任何人都可以提交自己的数据,获得相应的推断结果。机器学习推断服务的普及大大降低了机器学习的门槛,但在当前的机器学习推断服务系统中,客户需要将数据以明文形式直接提交给服务商,牺牲了自己的隐私。同时,机器学习模型属于服务商的私有资产,因此不能把模型直接发送给客户,由客户本地执行运算后获得推断结果。更重要的是,近年来各国出台了不少有关数据安全的法律法规,对于数据安全和隐私保护有了更加严格的规定。而在机器学习推断服务系统中,决策树模型占据半壁江山。因此,如何设计一个高效的具有隐私保护特性的决策树推断服务系统,成为了一个研究重点。本文主要研究内容如下:1.对于决策树推断服务系统中,各个参与方隐私保护的需求进行了详细分析。明确了服务商决策树模型大小无法保护的原因,给出了通过添加哑节点进行预处理,对决策树模型大小进行盲化的解决方案。在公开经盲化的决策树模型大小后,即可使用基于秘密共享的安全多方计算技术进行系统设计。使用基于秘密共享的安全多方计算方案,避开了开销较大的公钥密码学原语,大大降低了计算开销,减少了通信开销,使在手机等轻量级设备上运行具有隐私保护特性的决策树推断服务成为可能。2.为了使具有隐私保护特性的决策树推断服务系统能够运行,普遍需要服务商把决策树模型的结构告知参与方,为此服务商需要将决策树扩充为完美二叉树,从而保护决策树模型的结构,但这直接将性能开销提升了指数倍。本文根据秘密共享方案中,逻辑非门运算的特点,提出了一种客户无须获得决策树模型全部结构,即可运行安全计算协议的方案,从而无需使决策树模型扩展为完美二叉树。在实现隐私保护需求的同时,避免了整个系统开销指数级的提升。3.根据决策树推断服务系统的特点,本文将整个系统设计拆分为了四个基础模块:属性选择模块、比较运算模块、决策索引向量生成模块和决策结果求值模块。并且针对这四个模块的特点,分别设计了定制化高效的基于秘密共享的安全两方计算协议,并证明了各协议的安全性。相比直接使用朴素的通用方案实现各模块,性能有较大程度提升。通过对于基础模块的顺序组合,本文设计的具有隐私保护特性的决策树推断服务系统具有高效、简洁、易懂的特点,且无需可信第三方参与,有利于在真实场景中落地推行。同时,对方案的安全性进行了证明,并通过模拟真实世界的网络环境进行实验,证明了该方案的实用性。
其他文献
二氟羧酸苯甲醚类化合物可以通过各种酚与二氟溴乙酸乙酯反应制备,它们具有廉价易得、种类多样以及易纯化和对空气和水汽稳定等优点。近些年来,各个国家的化学研究人员对脱羧
随着我国经济发展,快速城镇化带来的人口聚集和城市扩张,导致城市用地紧张。大型综合体在这种情况下,通过三维的空间手段向高空发展,屋顶空间逐渐被利用起来。屋顶空间的利用
砖混结构作为我国一种极为常见的建筑结构形式,自上个世纪70年代以来被广泛应用于各类建筑工程中。但随着大量的工程实践,其砌体材料抗弯、抗剪和抗拉性能差,砂浆粘结力弱,整
再保险是指保险人在原保险合同的基础上,通过签订分保合同,将其所承担的部分风险转移给其他保险人进行保险的行为.许多文献都仅从保险人一方的角度考虑其利润最大,却忽略了再保险人的利益,相对来说是不太公平的.所以,我们需要同时考虑保险人和再保险人双方的利益,进而找出一种最优的再保险策略.本文基于期望值原理用CVaR度量保险人和再保险人的最优化问题.全文分为5章:第1章是引言.主要概述了再保险的研究背景、国
两系杂交水稻在中国的发展已经超过30年,与三系杂交水稻相比,因组配自由、制种程序简单等优势已逐步发展成为我国杂交水稻的主要类型之一。但是两系杂交水稻对主要病虫害包括
近年来,成都市提出了以"小组生微"为特征的新农村综合体来引领农村新社区建设。它是成都结合乡村实际,继"三个集中"和"四态"融合之后提出的又一创新理念,已涌现出一些优秀的"
量子关联作为量子信息中可以加速处理信息的资源,在量子信息科学中有着越来越重要的地位。在量子信息科学发展的初期,人们普遍认为量子关联只有纠缠这一种形式,但随着研究的进一步深入,研究者们发现量子关联还有量子失协、量子相干等形式,纠缠并不是唯一可以加速信息处理的资源。目前,量子信息科学的首要任务就是研究量子关联,而量子关联除了在信息处理上的应用之外,也可以在其他诸如量子态演化、量子相变等领域有所应用,并
白色念珠菌是一种临床常见的条件性致病菌,易存在于正常人口腔、呼吸道、肠道及阴道等,为常见念珠菌病的主要致病菌。白色念珠菌是二倍体,没有性周期,能够从单细胞芽酵母到丝
目的:较腹泻型肠易激综合征(IBS-D)患者应用利福昔明治疗前后粪便涂片菌群的变化和症状改善情况,探讨粪便细菌涂片对腹泻型肠易激综合征应用抗生素治疗的参考价值。方法:选取
在当今中国特色社会主义新时代,农业农村发展的好与坏已关系到中国社会的发展,为了实现全面建成小康社会的目标,夯实社会主义现代化基础,加快农业农村发展进程,重视“三农”问题事关重大。习近平总书记在党的十九大报告中明确要求“实施乡村振兴战略”,并对“三农”工作作出了全面部署,突出强调要以“三农”工作为总抓手。在此背景下,为了适应新时代的发展,解决社会的主要矛盾,提升农民综合素质增加收入,促进农村经济发展