IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 第三课学习笔记 深度学习模型训练和关键参数调优详解 -> 正文阅读

[人工智能]第三课学习笔记 深度学习模型训练和关键参数调优详解

一、模型选择:从任务类型出发,选择最适合的模型
1、回归任务
从使用Numpy推导,到使用深度学习框架,一步步走进最简单的回归任务:当人工智能邂逅蓝桥杯算法题,会擦除怎样的火花?(链接:https://aistudio.baidu.com/aistudio/projectdetail/1693536?channelType=0&channel=0)

(1)实现原理

a.从最简单的神经网路开始

b.神经网络工作原理概述

c.使用多个输入进行预测

d.只用一个输入做出多个输出

e.基于多个输入得到多个输出

f.用预测结果进一步预测

(2)拟合斐波那契数列

a.问题描述:输入格式、输出格式

b.生成数据:输入数据、数据对应的标签、将数组转换成张量

c.构建线性回归模型

d.构建优化器和损失函数

e.模型训练

f.模型验证

(3)大等于n的最小完全平方数

a.问题描述:输入格式、输出格式

b.生成数据

c.构建线性回归模型

d.构建优化器和损失函数

e.模型训练

f.模型验证

小结:先用传统方法人脑解题,写出能算出结果的函数,然后根据这一函数生成训练数据,最后训练出线性回归模型。使用简单的线性变换层组建网络,使用少量数据进行拟合,模型输出能近似预期结果,但还有一定的差距,有很大的提升的空间,感兴趣的开发者可以基于本项目,尝试使用更多的数据、更复杂的网络等。

人脸关键点检测:基于空间注意力SAN与GoogLeNet实现人脸关键点检测并自动添加表情贴纸(链接:https://aistudio.baidu.com/aistudio/projectdetail/1533049?channelType=0&channel=0)。

2、分类任务
? ? ? CIFAR-10数据集也是分类任务中一个非常经典的数据集,在科研中,常常使用CIFAR数据集评估算法的性能。

图像分类:从论文到代码深入解析带有门控单元的gMLP算法。(链接:https://aistudio.baidu.com/aistudio/projectdetail/2134364)

3、场景任务
? ? ? 这里说的场景任务是针对某一个特定的场景开发的深度学习任务,相比于回归和分类任务来说,场景任务的难度更高。这里说的场景任务包括但不限于目标检测、图像分割、文本生成、语音合成、强化学习等。

目标检测:基于PaddleX的YOLOv3模型快速实现昆虫检测(链接:https://aistudio.baidu.com/aistudio/projectdetail/442375)。

人像分割:基于PaddleX核心分割模型 Deeplabv3+Xcetion65 & HRNet_w18_small_v1 实现人像分割,PaddleX提供了人像分割的预训练模型,可直接使用,当然也可以根据自己的数据做微调(链接:https://paddlex.readthedocs.io/zh_CN/release-1.3/examples/human_segmentation.html)。

文字识别:基于chinese_ocr_db_crnn_mobile实现文字识别,识别图片当中的汉字,该Module是一个超轻量级中文OCR模型,支持直接预测(链接:https://www.paddlepaddle.org.cn/hubdetail?name=chinese_ocr_db_crnn_mobile&en_category=TextRecognition)。

二、模型训练
? ? ? ?仅基于原生Python和Numpy看模型训练基本原理:神经网络梯度下降原理详解(链接:https://aistudio.baidu.com/aistudio/projectdetail/757995)。

1.?基于高层API训练模型:通过Model.prepare接口来对训练进行提前的配置准备工作,包括设置模型优化器,Loss计算方法,精度计算方法等。

2.?使用PaddleX训练模型:YOLOv3模型的训练接口示例,函数内置了piecewise学习率衰减策略和momentum优化器。

三、超参优化
? ? ? ? ? ?1.?超参优化的基本概念

2.?手动调整超参数的四大方法:使用提前停止来确定训练的迭代次数,让学习率从高逐渐降低,宽泛策略,小批量数据(mini-batch)大小不必最优。

四、效果展示
? ? ? ? ? ?1.?可视化输入与输出:直接可视化输入与输出是最直接的方法。

2.巧用VisualDL:VisualDL文档:https://ai.baidu.com/ai-doc/AISTUDIO/Dk3e2vxg9#visualdl%E5%B7%A5%E5%85%B7

3.权重可视化:InterpretDL源码:https://github.com/PaddlePaddle/InterpretDL

总结:
? ? ? ? ? ?1、重要的是神经网络工作的基本原理,搞懂了原理,才能更好地进行超参优化,得到更好的模型效果。

2、学会使用SubClass形式组网,科研需要一定要学会用SubClass形式组网。

3、模型训练,超参数的选择有很多讲究,超参的好坏往往会影响模型的最终结果。

4、效果展示十分重要,是一个项目的加分项。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-02 10:49:09  更:2021-08-02 10:52:02 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/22 15:12:12-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码