IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 迁移学习(Transfer Learning) -> 正文阅读

[人工智能]迁移学习(Transfer Learning)

1. 迁移学习 Transfer Learning

1.1 Motivation

  • 能在一个任务上学习一个模型,然后用其来解决相关的别的任务,这样我们在一个地方花的时间,学习的一些知识,研究的一些看法可以在可以在另外一个地方被使用到;
  • 在深度学习中我们会训练很多深层的神经网络, 训练这些神经网络需要大量(带标签)数据,同时训练的代价非常高。就是说,我们很难对每一个任务都去制作一个巨大的数据集去训练。

如果我们在一个任务上训练好的模型,能在其他地方使用,效果最好。

1.2 Approaches

  • 训练好一个模型,然后把它做成一个特征提取的模块(例如:ResNet,VGG16);
  • 在一个相关的任务上训练好一个模型,然后在另一个任务上直接用它;
  • 训练好一个模型,然后对其进行微调,使得模型在新的任务上能够适应。

1.3 Related to

  • 半监督学习:利用未标记数据,帮助带标记数据推进工作;
  • zero-shot / few-shot learning:极端条件下,任务中我们没有样本或者样本很少。对于前者,我们必须学习到关于这个新样本特征的映射。对于后者,我们可以在 big data sets 上面先学习到一个一般化的映射,然后再到少量样本上进行映射的更新或升级;
  • 多任务学习:每一个任务都有自己的数据,数据量不够,这是前提。但每个任务之间是相关的,那么可以将所有的数据放在一起,然后同时训练多个任务,任务之间互相收益。

2. Applications in CV

2.1 转移知识 Transferring Knowledge

在这里插入图片描述

datasetImageNetCar-datasetMnist
examples1.2M50K60K
classes100010010
  • 存在许多大规模的已经标注好的CV数据集;
  • 通常自己任务的数据集会比大的数据集(例如ImageNet)小很多。正常情况下,在不知道模型效果如何的情况下,我们是慢慢投入数据。如果效果好,就继续投入,这是一个迭代的过程。

2.2 预训练 Pre-trained

在这里插入图片描述
对于一般的神经网络,我们可以把它分成两部分,一部分叫编码器(做特征提取,将原始图片的原始像素转化在一个语义空间中可以线性可分的一些特征),另一部分叫解码器(简单的线性分类器,将编码器的表示映射成想要的标号,或者是做一些决策)。

预训练模型:

在一个比较大的数据集上训练好一个模型,具有一定的泛化能力(放在新的任务上或者新的数据集上,原模型多多少少有点效果)。举个例子,一个解决分类的神经网络模型,即使最后它完成的是分类问题,但在网络的前面几层,它还是学会了如何去处理图片像素的信息。

2.3 微调 Fine-Tuning

在这里插入图片描述

微调是怎么做的:

  • 在新的任务上构建一个新的模型,但新模型的架构要跟与训练的模型架构一致;
  • 在找到合适的预训练模型之后要初始化我们的模型(将预训练模型中,除了最后一层之外的权重都复制给自己的模型;最后一层还是用随机的权重)。
  • 在初始化后,就可以开始学习了,这步跟我们平常的学习没有什么区别。

2.4 固定最底层 Freeze Bottom Layers

2.5 fine-tuning 的一些应用

3. 总结

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-01 00:02:58  更:2022-04-01 00:05:40 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/9 1:51:17-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码