IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Unsupervised Data Augmentation for Consistency Training -> 正文阅读

[人工智能]Unsupervised Data Augmentation for Consistency Training

Abstract

当标准数据不足时,半监督学习展现出很大的优势。
近期方法的一个共同点是在大量 无标注 数据上使用 consistency training 来约束模型预测结果,使其具有 输入噪音不变性invariant to input noise).

本文从一个新的角度出发,探究如何有效地为无标签数据添加噪音。并且指出 噪音的质量 尤其是那些由高级数据增强方法产生的噪音的质量,在半监督学习中扮演了关键的角色。

在同样的 consistency training 框架下,通过使用高级的数据增强方法(如 RandAugment and back-translation)来代替简单的加噪操作,我们的方法在 6 种自然语言和 3 种视觉任务上带来显著的提升。

在 IMDb 文本分类数据集上,在只有 20 个标注样本的情况下,我们的方法将错误率降到了 4.20,好于在 25,000 个标注样本上训练的 SOTA 模型。

在一个标准的半监督学习 benchmark CIFAR-10 上,我们的方法超过之前的所有方法并且将错误率降低到了 5.43. 做到这一点,我们只用了 250 个标注样本

我们的方法和迁移学习也能很好地结合。

Introduction

半监督学习(Semi-supervised learning (SSL))是利用大量无监督数据的一种有效范式。consistency training 是对模型预测的一种正规化,使其无论是对施加于输入样本或是隐层状态上的噪声都能保持预测结果不变。通常的噪音注入方法包括

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-13 21:47:25  更:2022-03-13 21:49:48 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/9 15:40:10-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码