面向模态数据隐私保护的多模态学习技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:shi_bc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,大量的复杂数据对象可以从多种信息渠道被获取或由不同提取方式的多模态特征来描述。因此,多模态学习引起了研究者的广泛关注。通过利用多个模态信息之间的关系,多模态学习能够有效地提升学习效果。而在一些真实应用场景中,不同模态的数据特征可能来自不同的私有数据源,要求在学习模型的训练和测试过程中数据源之间不能共享数据信息,也即在利用多模态特征之间的关系的同时也要保护数据隐私。同时,这种竞争-合作场景不仅需要融合多模态数据学习得到一个很好的综合结果,还要求每个模态上的个体学习器的性能也得到增强。本文面向模态数据隐私保护的多模态学习技术,做出以下工作:1.为了同时提升多模态学习器和模态个体分类器的学习效果,本文提出了一种基于模态预测值一致性的新颖的混合式模态融合框架。通过对累积预测矩阵加上低秩约束来减少模态个体分类器的偏差,学习得到提升了的模态融合结果;然后回传给每个模态以更新各自的模型参数,优化学习器性能。学习过程只需获得每个模态分类器的预测输出,不接触模态特征,从而保护了数据隐私。此外,本文还给出了多种参数优化算法和二分类问题下的加速版本。最后本文在一系列多模态数据集上就性能指标和训练时间进行了实验比较和显著性分析。2.更好地利用未标记样本能够减少对来自隐私数据源的有标记样本的需求,因此本文定义了一种新的模态一致性指标。在协同训练框架下,对所有其他模态个体分类器对未标记数据的预测结果的进行低秩后融合,将得到的一致性结果作为该样本的置信度打分,用以选择最为确定的样本子集来增大某个模态的训练集,从而实现模态个体学习器的互相提升。训练过程中没有模态特征的互访,大量使用未标记样本也进一步降低了对初始分类器的要求。多个真实数据集上的结果表明了本文所提方法的有效性,尤其在处理模态数量较多的数据时的优越性。
其他文献
顶点代数是基础数学中十分活跃的研究领域,目前,关于顶点代数的研究主要集中在复数域上.H-模顶点代数是一类重要的顶点代数,H-模顶点代数是特征零时拟顶点算子代数在素特征的
到目前为止,前人已经对射流冲击进行了一系列的理论与试验研究。但是,这些研究往往针对清水进行,对于含沙水流却很少涉及。而我国含沙河流数量众多,分布广泛,尤其在西北及华
微流控技术因其低成本、便携、高通量的特点一直是学术和商业领域研究的热点,近年来,随着人们对医疗水平的要求的提高,微流控技术的应用变得愈发广泛。微流控技术是将生化检
五四运动震动了全国,也震动了天津。1919年5月17日,周恩来到南开学校参加"敬业乐群会"的茶话会。他这时还没有入学,只有一个校友的身份;但对这样一场热烈的爱国学生运动,他难
本文主要研究时间分数阶扩散波方程非光滑空间源项的辨识问题。首先基于正问题解的级数表达式,将反问题转化为求解第一类Fredholm积分方程,讨论反问题的解的存在唯一性及不适
通过对部分国内外砂浆强度检测方法的研究查阅,发现国内外对于承重结构砂浆强度的检测方法研究分析比较成熟,例如:检测烧结普通砖和烧结多孔砖的筒压法、砂浆片剪切法以及砂
随着人们月面探索的不断深入,月尘对探月设备的危害变得越来越突出。目前人们针对月尘清除提出流体除尘、机械除尘以及基于电场力除尘等方法,而基于铁电陶瓷镧改性锆钛酸铅(P
非晶态聚合物在工程和生活中都有广泛应用,不可避免的会在多种环境激励下发生形变,研究非晶态聚合物在多场耦合下的力学响应以及揭示其分子机理对非晶态聚合物的应用和设计都
能源问题是人类亟需解决的问题之一。与传统的化石能与核能相比,太阳能作为一种清洁能源,由于其具有来源广、无污染、能量巨大等优点,为人类解决能源问题提供了一条途径。基
稀磁半导体材料同时利用电子的电荷属性和自旋属性,具有优异的半导体和磁学性能,在未来自旋电子器件中有广泛的应用前景。因此,开发更多优异的具有室温或高温铁磁性的新型稀