IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【文献阅读】Label Inference Attacks Against Vertical Federated Learning -> 正文阅读

[人工智能]【文献阅读】Label Inference Attacks Against Vertical Federated Learning

【文献阅读】Label Inference Attacks Against Vertical Federated Learning

这篇文章提出了三种针对纵向联邦学习的标签推理攻击:

  1. 被动标签推理攻击(完全化本地模型使之具有推理能力)
  2. 主动标签推理攻击(主动地增加本地模型在全局的权重)
  3. 直接标签推理攻击(直接通过梯度符号判断标签)

并利用常见的VFL防御方法对本文提出的攻击手段进行了测试,结果表明本文提出的攻击手段具有良好的表现。

1. 背景

1.1 架构

如图所示公司A和公司B的数据库中有部分用户ID重叠,且他们各持有不同的特征。使用纵向联邦学习训练预测模型,其中B为服务器,持有标签、顶部模型和底部模型;A只持有底部模型,并为B提供特征训练顶部模型。

训练流程:A和B根据本地特征进行训练,对应的底部模型生成一个中间结果发送给B->B的顶部模型接收到中间结果后,对结果进行聚合,计算误差,将梯度返回给A和B的底部模型->底部模型根据梯度计算本地参数的更新

image-20220921184655484

1.2 威胁模型

公司A 是curious-but-honest,目的是对推理出B的标签。

在无模型分割的VFL中,由于VFL的特性,A只能控制联邦模型的一部分(A的底部模型),这一部分模型只能接收到来自服务器的一部分梯度,并且没有预测能力

2. 标签推理攻击

2.1 VFL中可能的隐私泄露点

底部模型的泄露

VFL中,在训练阶段和预测阶段,威胁者可以完全掌控其底部模型。底部模型提供一个具有代表性的特征表示以供预测,一个恶意底部模型的表达能力取决于它的训练程度和它与最终预测层的接近程度

梯度的泄露

威胁者可以直接基于接收到的梯度进行标签推理攻击

2.1 Passive Label Inference Attack through Model Completion

目标:威胁者通过完善本地底部模型,使得本地模型具有预测能力

过程:利用少量的带标签的数据,在本地模型之上添加一个分类层,以供标签推理

方法:改进半监督学习算法MixMatch算法,添加到底部模型之上,使得底部模型成为完全模型,具有预测能力

MixMatch算法通过对少量标记数据和未标记数据进行数据增广,再分别计算两者的损失,最终的整体损失是两者的加权。参考:超强半监督学习 MixMatch

改进的点在于去掉了对x和u的数据增广这两行代码,作者的说法是这样做可以使得MixMatch适用于更多的领域,而不仅仅是CV

原MixMatch算法:

image-20220921192535521

本文算法:

image-20220921192624324

2.2 Active Label Inference Attack with the Malicious Local Optimizer

目标:威胁者可以加速他/她的底部模型上的梯度下降,从而在每次迭代中向服务器提交更好的特性。最后,它使得顶层模型更多依赖于自己的底层模型,而不是其他参与者。换句话说,威胁者可以在训练底部模型的时候恶意地扩大学习率

挑战:设置过大的学习率,会使网络参数从最短路径偏离到局部最优路径,并在局部最小点附近震荡。

方法:为了解决这一挑战,设计了一个自适应的恶意局部优化器,它自适应地放大了对手的底部模型中每个参数的梯度。如算法1所示,β是动量参数,G是损失关于底部模型中每个参数的梯度,rθ是自适应梯度缩放因子,vθ是之前迭代中每个比例梯度的指数移动平均值(也成为速度)。

  1. 接收来自服务器的返回梯度Goutput
  2. 反向传播计算G
  3. 根据指数移动平均计算Vθ
  4. 如果不是首轮迭代的话:
    1. 计算rθ,γ是超参数(本文中设为1),vlast是上一轮迭代中vθ的值
    2. rθ根据上下限进行限制,然后对vθ进行缩放
  5. vlast更新为vθ,θ根据学习率和vθ进行更新

通过使用这种机制,恶意的局部优化器通过自适应缩放因子来放大梯度。为了说明自适应比例因子是如何工作的,处于简化的考虑,我们研究只有一个参数的情况:它只有两个优化方向:增加或减少。如果速度(该参数的速度)与最后一次迭代的速度有一个相反的符号,则认为它是一个振荡信号。相应地,恶意的本地优化器会减少比例因子。这种直觉类似于经典的优化算法Rprop [40]。相反,如果速度的符号在一系列迭代中保持不变,可以推断参数在一个方向上稳定优化。然后,恶意的本地优化器将增加比例因子,以实现更快的优化

image-20220921194423260

通过在训练阶段使用恶意的局部优化器,对手可以得到一个训练好的具有更多标签隐藏信息的底部模型。然后,对手可以在被动推理攻击中进行模型完整化,得到最终的标签推理模型。主动标签推理攻击有望提高标签推理的准确性。

2.3 Direct Lable Inference Attack

根据接收到的来自预测层的梯度来推理对应的标签,适用于主流的用于分类的损失函数,如交叉熵损失,带权交叉熵存世,负对数似然损失。本文以交叉熵损失为例:

image-20220921201139535

x是一个样本的特征,c是真实标签,yk是输出层的激活后的输出,adv号参与者是威胁者,对应于威胁者的第i个logit的梯度为:

image-20220921201411394

如果i=c的话,gi_adv为负,否则为正,因此gi_adv的符号指出了第i个预测标签是否为真实标签。所以威胁者可以根据服务器发回的梯度推断标签。这样可以获得少量真实标签,然后可以与上文提到的Passive Label Inference Attack相结合

3. 实验

a 已知标签数据量对攻击的影响

image-20220921202152851

已知数据越多,攻击表现越好

b 攻击对模型精度的影响

image-20220921202251020

影响不大

c 威胁者拥有的特征对精度的影响

image-20220921201801868

威胁者特征越多,训练出的完整模型精度越高

d 参与者数量对攻击效果的影响

image-20220921202343104

参与者数量越多,攻击者对顶部模型的权重越小,攻击效果越差

e 使用主动攻击时,攻击者对标签的分类效果更好

image-20220921202900190

4. 防御

FL常见的防御手段:

  1. 梯度加噪
  2. 梯度压缩:只分享一部分梯度
  3. 隐私保护的深度学习:它包括三种防御策略:差异隐私、梯度压缩和随机选择
  4. 离散SGD

4.1 针对主动和被动标签推理防御效果分析

  1. 梯度加噪

    小范围内的噪声并不能降低标签泄漏的风险。大规模噪声可以成功地减轻标签推理攻击,但代价是显著降低了联邦模型在原始任务上的性能

  2. 梯度压缩

    梯度压缩可以成功地减轻标签推理攻击,但代价是显著降低了联邦模型在原始任务上的性能

  3. 隐私保护的深度学习

    在所有三个数据集上,通过将超参数θu设置为0.25或更低的深度学习,可以减轻标签推理攻击。然而,联邦模型在原始任务上的性能下降也很显著,这与在HFL上报告的结果不同。VFL对从服务器到参与者的共享梯度上的修改更为敏感。这就解释了为什么保护隐私的深度学习可能是HFL的一个很好的防御,但不适合VFL。

  4. 离散SGD

    在三个数据集上,随着超参数N的减小(梯度变得更加离散),攻击性能和联邦模型对原始任务的性能都显著下降,这表明离散esgd不能有效地抵御主动标签推理攻击。

image-20220921203129575

4.2 针对直接标签推理攻击防御效果分析

image-20220921204209300

本章评估了四种主流的防御方法,实验结果表明,这些防御方法虽然有效地减轻直接标签推理攻击,但对被动标签推理攻击和主动标签推理攻击无效。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-09-24 20:57:15  更:2022-09-24 20:59:31 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/28 18:35:57-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计