面向企业数据孤岛的联邦排序学习

来源 :软件学报 | 被引量 : 0次 | 上传用户:johndovl1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
排序学习(learning-to-rank,简称LTR)模型在信息检索领域取得了显著成果,而该模型的传统训练方法需要收集大规模文本数据.然而,随着数据隐私保护日渐受到人们重视,从多个数据拥有者(如企业)手中收集数据训练排序学习模型的方式变得不可行.各企业之间数据被迫独立存储,形成了数据孤岛.由于排序模型训练需要使用查询记录、文档等诸多隐私信息,数据孤岛难以融合打通,这制约了排序学习模型的训练.联邦学习能够让多数据拥有方在隐私保护的前提下联合训练模型,是一种打通数据孤岛的新方法.在其启发下,提出了一种新的框架,即面向企业数据孤岛的联邦排序学习,它同时解决了联邦学习场景下排序学习所面临的两大挑战,即交叉特征生成与缺失标签处理.为了应对多方交叉特征的生成问题,使用了一种基于略图(sketch)数据结构与差分隐私的方法,其相比于传统加密方法具有更高的效率,同时还具有隐私性与结果精度的理论保证.为了应对缺失标签问题,提出了一种新的联邦半监督学习方法.最终,通过在公开数据集上的大量实验,验证了所提方法的有效性.
其他文献
红酒养颜自是大家都知晓的,但在寂寞时即使是微酌也还是易醉的。所以,用作下菜的一味材料,既不失态,也能赚得飘飘然的自得。迷醉在自己炮制的风情中。 Wine is naturally kn
通过对以激光测距技术和精密分度技术原理为基础的三维激光扫描技术在铁路罐车和罐式集装箱应用中的研究,介绍了三维激光扫描铁路罐车和罐式集装箱流程,即获取、修复、优化海
会议
目前的环境问题非常突出,环境监测技术也成为解决环境问题最重要的举措之一,这项技术的发展主要通过对一些污染物进行分析和研究,从而对环境的污染问题做到实地的考察,从根源
在我国环保事业发展中,环境监测工作发挥着非常重要的作用,它为环保部门的决策提供参数依据,也为区域内环境状态提供科学参考,同时,还可以帮助区域环保监督部门进行污染源分
高阶链接预测是当前网络分析研究的热点和难点,一个优秀的高阶链接预测算法不仅可以挖掘出复杂网络中节点间存在的潜在联系,还有助于认识网络结构随时间演化的规律,对于探索
在播放VCD机时,出现常停顿的现象主要有以下几方面的原因: 一、若是在原有CD唱机上加装MPEG解压缩卡改装而成的VCD机,所用机芯并不是VCD机专用的,VCD专用机芯对光头的跟踪寻
目前,变配电安装工程施工的时候,如果没有掌握好科学的施工方法,必定会导致施工出现各类问题,所以,为了保证变配电安装工程施工的效果,必须要分析其施工问题.
本文重点针对新疆区域内特殊的汽车油罐车结构,以及就目前采用的三种容量计量检定方法存在的细节问题,予以叙述并讨论。指出,容量比较法现场检定存在标准量器标称容积刻度定位
时空图建模是分析图形结构系统中各要素空间关系与时间趋势的一个基础工作.传统的时空图建模方法主要基于图中节点与节点关系固定的显式结构进行空间关系挖掘,这严重限制了模
DVD声音工作组(WG-4)草拟出DVD声音的规格,计划1997年12月中制定出最终方案,并于1998年确定规格。98年底开始生产DVD规格的CD软 The DVD Sound Working Group (WG-4) drew