| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> Decoupling Representation and Classifier for Long-Tailed Recognition论文笔记 -> 正文阅读 |
|
[人工智能]Decoupling Representation and Classifier for Long-Tailed Recognition论文笔记 |
Decoupling Representation and Classifier for Long-Tailed Recognition论文笔记Facebook出品,ICLR2020会议论文,官方代码 摘要视觉世界的长尾分布对基于深度学习的分类模型提出了巨大的挑战,即如何处理类不平衡问题。现有的解决方案通常涉及类平衡策略,例如通过损失重新加权、数据重新采样,或将学习从头尾类转移到尾类,但大多数方案都坚持联合学习表征和分类器的方案。在这项工作中,我们将学习过程分解为表征学习和分类,并系统地探讨了不同的平衡策略对长尾识别的影响。研究结果令人惊讶:(1)数据不平衡可能不是学习高质量表征的问题;(2) 通过最简单的实例平衡(自然)采样学习表示,也可以通过仅调整分类器来实现强长尾识别能力。我们在ImageNet LT、Places LT和iNaturalist等常见长尾基准测试上进行了广泛的实验,并设定了最新的性能,结果表明,通过使用一种简单的方法,将表示和分类解耦,可以超越精心设计的损耗、采样策略,甚至是带有内存的复杂模块。 引言现有方法背后的共同信念是:设计适当的采样策略、损失,甚至更复杂的模型,对于学习用于长尾识别的高质量表示很有用。 联合学习方案使得长尾识别能力是如何实现的尚不清楚——是通过学习更好的表示还是通过移动分类器决策边界更好地处理数据不平衡? 为了回答这个问题,我们将长尾识别与表征学习和分类分离。 对于表征(特征)学习,训练的样本直接喂给模型,并通过不同的采样策略或损失进行训练。 对于分类,根据学习到的特征,模型通过各种分类器识别长尾类。 我们评估了在联合和解耦学习方案下用于长尾识别的各种采样和分类器训练策略的性能。 具体来说,我们首先采用不同采样策略训练模型来学习特征,包括基于实例的采样、类平衡采样以及它们的混合。接下来,我们研究了三种不同的基本方法,以在学习到的特征的基础上获得具有平衡决策边界的分类器。
实验结果:
相关工作长尾学习主要有三个方向:
学习长尾数据中的特征我们真正感兴趣的是获得能够很好地识别所有类的模型。 符号约定采样策略
损失函数重加权策略一些文章中的高性能的方法很难训练和重现,并且在许多情况下需要广泛的、特定于数据集的超参数调整 用于长尾识别的分类器在平衡数据集上学习分类模型时,分类器权重 W 和 b 通常与模型参数 θ 联合训练,以通过最小化 真值和预测值之间的交叉熵损失来提取特征。 这也是长尾识别的典型基线。 尽管已经提出了从头到尾类重新采样、重新加权和迁移特征的各种方法,但总体方案保持不变:分类器要么与特征学习(比如一个提取特征的CNN网络)进行端到端的联合学习,要么通过两阶段方法,分类器和第一阶段通过类平衡策略得到的特征再联合微调 在本节中,我们考虑将特征提取与长尾识别中的分类器解耦。 我们提出了学习分类器的方法,旨在通过使用不同的采样策略或其他非参数方法(例如最近类均值分类器)进行微调来纠正头类和尾类的决策边界。 我们还考虑了一种重新平衡分类器权重的方法,该方法表现出高长尾识别精度,无需任何额外的训练。 分类器重新训练(Classi?er Re-training,cRT)一种最简单直接的方法是使用类平衡采样重新训练分类器。 Nearest Class Mean classi?er (NCM)首先计算训练集上每个类的平均特征表示,然后使用余弦相似度或在L2归一化平均特征上计算的欧几里得距离执行最近邻搜索。 τ \tau τ-normalized classi?er ( τ \tau τ-normalized)我们研究了一种重新平衡分类器决策边界的有效方法,受经验观察的启发:在使用实例平衡采样进行联合训练后,权重
w
j
w_j
wj?的范数与类
n
j
n_j
nj?的基数相关,但是在使用类平衡采样对分类器进行微调之后,分类器权重的范数往往更加相似(参见图 2-左) Learnable weight scaling (LWS)上述策略的变体,冻结整个网络参数,找超参数 实验部分实验结果分析联合训练时采样策略很重要。联合训练时,渐进平衡采样最好。 实例平衡采样为头部类提供了最高性能。因为生成的模型高度偏向于头部类。 联合训练还是解耦训练?从图1结果来看,使用解耦方法在整体性能以及除了many shot情况外都明显更好。 实例平衡采样得到的特征最具有泛化性。
总结在这项工作中,我们探索了一些用于长尾识别的学习方案,并将联合学习表示和分类器与一些简单的解耦方法进行比较。 通过广泛的研究,我们发现虽然采样策略在联合学习表示和分类器时很重要,但实例平衡采样提供了更通用的表示,在适当地重新平衡分类器后可以实现最先进的性能,而无需精心设计 损失或记忆单位。 我们为三个长尾基准设置了新的最先进的性能,并相信我们的发现不仅有助于更深入地理解长尾识别任务,而且可以为未来的工作提供灵感。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/1 22:42:12- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |