IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> [半监督学习] Deep Metric Learning-Based Semi-Supervised Regression With Alternate Learning -> 正文阅读

[人工智能][半监督学习] Deep Metric Learning-Based Semi-Supervised Regression With Alternate Learning

论文地址: Deep Metric Learning-Based Semi-Supervised Regression With Alternate Learning
代码地址: https://git.tu-berlin.de/rsim/DML-S2R
会议: ICIP 2022
任务: 回归

与之前的一篇文章 MSSR 类似, 在 MSSR 中, 通过度量学习来学习嵌入空间, 在新空间上执行目标数据点的回归估计. 并且都利用了孪生神经网络(Siamese neural network, SNN). 关于孪生神经网络的定义已在 MSSR 中进行相关介绍.

DML-S2R 旨在通过有效地利用未标记数据和标记数据来学习相似样本的度量空间. DML-S2R 方法由两个主要步骤组成: i) 使用标记数据进行成对相似性建模; ii) 具有大量未标记数据的基于三胞胎网络(Triplet network, 是孪生神经网络的变体形式)的度量学习. 如下图所示:
在这里插入图片描述
符号系统定义如下:

  • S = { ( x i l , y i l ) } i = 1 N \mathcal{S}=\{(x_i^l,y_i^l)\}_{i=1}^N S={(xil?,yil?)}i=1N? 表示标记数据集.
  • U = { x j u } j = 1 M \mathcal{U}=\{x_j^u\}_{j=1}^M U={xju?}j=1M? 表示未标记数据集.
  • T = S ∪ U \mathcal{T}= \mathcal{S} \cup \mathcal{U} T=SU 表示训练集.

First Step: 使用标记样本训练孪生网络进行成对相似性建模

第一步主要进行相似性度量. 利用对比损失函数, 根据训练样本的目标值选择相似和不相似的对. DML-S2R 学习一个函数 f d f^d fd, 它用来估计两个标记样本的目标值差异:
f d ( x i l , x j l ) = y i l ? y j l (1) f^d(x_i^l,x_j^l)=y_i^l-y_j^l \tag{1} fd(xil?,xjl?)=yil??yjl?(1)
对于有 N N N 个样本的标记数据, 训练时会产生 N ( N ? 1 ) N(N-1) N(N?1) 对样本. 在 SNN 中, 对于输入数据对 { ( x i l , x j l ) } \{(x_i^l,x_j^l)\} {(xil?,xjl?)}, 网络输出其相似性结果 f d ( { ( x i l , x j l ) } ) f^d(\{(x_i^l,x_j^l)\}) fd({(xil?,xjl?)}). 令 z i j z_{ij} zij? 表示两个数据的目标差值, 定义损失函数如下:
L P S M = 1 N ( N ? 1 ) ∑ i = 1 N ∑ j = 1 N 1 [ i ≠ j ] ( z i j ? f d ( x i l , x j l ) ) 2 (2) \mathcal{L}_{\mathrm{PSM}}=\frac{1}{N(N-1)}\sum_{i=1}^N\sum_{j=1}^N\mathbb{1}_{[i \neq j]}(z_{ij}-f^d(x_i^l,x_j^l))^2 \tag{2} LPSM?=N(N?1)1?i=1N?j=1N?1[i?=j]?(zij??fd(xil?,xjl?))2(2)
其中 1 \mathbb{1} 1 表示指数函数. 使用该损失函数训练 SNN, SNN 模型学习完成后, 就可用其生成样本相似度的特征空间, 做为 Second Step 的基础.

Second Step: 使用未标记数据训练三胞胎网络进行度量学习

第二步旨在学习度量空间. 通过基于三胞胎的 DML 来实现, 该 DML 不仅考虑了标记样本, 还考虑了未标记样本. 基于三胞胎的 DML 需要一个三元组来表征度量空间. 因此, 将第一步的 SNN 转换为基于三胞胎的 SNN, 方法是在不改变权重的情况下, 对一个子网络复制三次, 从而使其适用于基于三胞胎的 DML.

标准三元组由一个锚定样本, 一个与锚定样本相似的正样本, 一个与锚定样本不同的负样本组成. 在这里, 锚定样本 x a l x_a^l xal? S \mathcal{S} S 中选取, 根据与锚定样本的目标值差异, 使用第一步中的 f d f^d fd U U U 中选取一组正样本 P x a l \mathbb{P}_{x_a^l} Pxal?? 和一组负样本 N x a l \mathbb{N}_{x_a^l} Nxal??, 每组的大小为 k k k. 具体选择算法如下:
在这里插入图片描述

  • 使用 f d f^d fd 估计每对的目标值差异. 与锚点差异最小的 k k k 个未标记样本被选择用于 P x a l \mathbb{P}_{x_a^l} Pxal??.
  • 与锚点差异最大的 k k k 个未标记样本被选择用于 N x a l \mathbb{N}_{x_a^l} Nxal??.

在为所有锚定样本选择正负集后, 采用排序列表损失函数:
w ( x a l , x j u ) = exp ? ( τ ( d ( x a l , x j u ) ? ( α ? m ) ) ) , L P ( x a l , S ) = ∑ x j u ∈ S w ( x a l , x j u ) ∑ x j u ∈ S w ( x a l , x j u ) L m ( x a l , x j u ) , L R L L = 1 2 N ∑ i = 1 N L P ( x a l , P x a l ) + L P ( x a l , N x a l ) (3) w(x_a^l,x_j^u)=\exp(\tau(d(x_a^l,x_j^u)-(\alpha-m))), \\ \mathcal{L}_P(x_a^l,\mathbb{S})=\sum_{x_j^u\in \mathbb{S}}\frac{w(x_a^l,x_j^u)}{\sum_{x_j^u \in \mathbb{S}}w(x_a^l,x_j^u)}\mathcal{L}_m(x_a^l,x_j^u), \\ \mathcal{L}_{\mathrm{RLL}}=\frac{1}{2N}\sum_{i=1}^N\mathcal{L}_P(x_a^l,\mathbb{P}_{x_a^l})+\mathcal{L}_P(x_a^l,\mathbb{N}_{x_a^l}) \tag{3} w(xal?,xju?)=exp(τ(d(xal?,xju?)?(α?m))),LP?(xal?,S)=xju?S?xju?S?w(xal?,xju?)w(xal?,xju?)?Lm?(xal?,xju?),LRLL?=2N1?i=1N?LP?(xal?,Pxal??)+LP?(xal?,Nxal??)(3)
其中, τ \tau τ 为温度参数, α \alpha α 为负样本边界, m m m 为边距, d d d 为测量特征空间两个样本间的欧几里得距离, L m \mathcal{L}_m Lm? 为边际损失函数.

整个学习过程从第一步训练 SNN 一个 epoch 开始, 同时最小化 L P S M \mathcal{L}_{\mathrm{PSM}} LPSM?. 然后, 使用所有锚定样本和相关的正负集对 SNN 进行一个 epoch 训练, 同时最小化 L R L L \mathcal{L}_{\mathrm{RLL}} LRLL?.

在两个步骤之间交替进行训练, 直到两个损失函数收敛. DML-S2R 训练完成后, 对于一个新样本 x ? x^* x? 的目标值估计如下:
y ? = 1 N ∑ i = 1 N f d ( x ? , x i l ) ? f d ( x i l , x ? ) 2 + y i l (4) y*=\frac{1}{N}\sum_{i=1}^N\frac{f^d(x^*,x_i^l)-f^d(x_i^l,x^*)}{2}+y_i^l \tag{4} y?=N1?i=1N?2fd(x?,xil?)?fd(xil?,x?)?+yil?(4)

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-03 16:13:20  更:2022-03-03 16:18:23 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 18:45:10-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码