IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> MixUp as Locally Linear Out-of-Manifold Regularization论文阅读笔记 -> 正文阅读

[人工智能]MixUp as Locally Linear Out-of-Manifold Regularization论文阅读笔记

MixUp as Locally Linear Out-of-Manifold Regularization

问题

MixUp方法会对一对输入的图像和其标签分别进行混合
x ^ = λ x + ( 1 ? λ ) x ′ y ^ = λ y + ( 1 ? λ ) y ′ \hat{x} = \lambda x+(1-\lambda)x'\\ \hat{y} = \lambda y+(1-\lambda)y'\\ x^=λx+(1?λ)xy^?=λy+(1?λ)y
作者发现,有时混合数据 x ^ \hat{x} x^会与已存在的数据特别类似,但此时他的标签是混合标签 y ^ \hat{y} y^?, 由此就会造成分类器的混乱,从而让其性能下降,作者称该状况为’流形入侵(manifold intrusion)’。

解决方案

引入两个神经网络 π ( ? ) \pi(\cdot) π(?) φ ( ? ) \varphi(\cdot) φ(?)分别用来生成混合所用的系数 λ \lambda λ和判断新混合的数据是否造成流形入侵,因为其混合所用的系数是自适应生成的,故该方法称为AdaMix。

方法详解

符号

χ \chi χ:全部的数据空间

Υ \Upsilon Υ:全部的数据标签空间

M \Mu M:流形空间

g ( x ) g(x) g(x):将 M \Mu M x x x映射到 Υ \Upsilon Υ空间的方程

D D D M \Mu M的子集

P ( Υ ) P(\Upsilon) P(Υ):标签的分布

F ( χ , Υ ) F(\chi,\Upsilon) F(χ,Υ):映射方程组

H H H F ( χ , Υ ) F(\chi,\Upsilon) F(χ,Υ)的子集

δ y \delta_{y} δy?:在y位置置1,即为one-hot-label

Λ \Lambda Λ:混合策略空间, Λ ? S k \Lambda\subseteq\mathbb{S}_{k} Λ?Sk?

Ω ( k ) \Omega^{(k)} Ω(k):定义了有 k k k个列数据的矩阵,同理 M ( k ) , D ( k ) M^{(k)},D^{(k)} M(k),D(k)

Adaptive MixUp(AdaMixUp)

定义一个网络 π k ( ? ) \pi_{k}(\cdot) πk?(?)用来生成 k k k个输入的混合策略,并将其写为 Λ ? ( X ) \Lambda^{*}(X) Λ?(X),其中 X X X是输入的 k k k个数据组成的列矩阵,且 Λ ? ( X ) ? S k \Lambda^{*}(X)\subseteq\mathbb{S}_{k} Λ?(X)?Sk?

定义另一个网络 φ ( ? ) \varphi(\cdot) φ(?)用来进行二分类,目的是预测混合后的数据是否属于流形入侵,若是则分为0类,否则为1,作者称其为入侵鉴别器

使用“intrusion loss”来训练鉴别器
L i n t r : = 1 k m a x ? 1 ∑ k = 2 k m a x E X ~ D k , λ ~ π k ( X ) log ? p ( 1 ∣ X λ ; φ ) + E x ~ D log ? p ( 0 ∣ x ; φ ) L_{intr}:=\frac{1}{k_{max}-1}\sum_{k=2}^{k_{max}}E_{X\sim D^{k},\lambda\sim\pi_{k}(X)}\log p(1|X\lambda;\varphi)+E_{x\sim D}\log p(0|x;\varphi) Lintr?:=kmax??11?k=2kmax??EXDk,λπk?(X)?logp(1Xλ;φ)+ExD?logp(0x;φ)
最后,全部的loss方程为:
L t o t a l : = L D ( H ) + L D ′ ( H , { π k } ) + L i n t r ( { π k } , φ ) L_{total}:=L_{D}(H)+L_{D'}(H,\{\pi_{k}\})+L_{intr}(\{\pi_{k}\}, \varphi) Ltotal?:=LD?(H)+LD?(H,{πk?})+Lintr?({πk?},φ)
其中 L D L_{D} LD? L D ′ L_{D'} LD?分别是对原始数据和混合数据的交叉熵损失。

应用

在实际使用中,作者只使用了k=2的模式,对用大于2的情况,就将前 k ? 1 k-1 k?1列数据看成一个整体与最后一列数据做 k = 2 k=2 k=2模式的操作即可。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-03 17:04:52  更:2021-10-03 17:06:48 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 14:05:16-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码