| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 第三课学习笔记 深度学习模型训练和关键参数调优详解 -> 正文阅读 |
|
[人工智能]第三课学习笔记 深度学习模型训练和关键参数调优详解 |
一、模型选择:从任务类型出发,选择最适合的模型 (1)实现原理 a.从最简单的神经网路开始 b.神经网络工作原理概述 c.使用多个输入进行预测 d.只用一个输入做出多个输出 e.基于多个输入得到多个输出 f.用预测结果进一步预测 (2)拟合斐波那契数列 a.问题描述:输入格式、输出格式 b.生成数据:输入数据、数据对应的标签、将数组转换成张量 c.构建线性回归模型 d.构建优化器和损失函数 e.模型训练 f.模型验证 (3)大等于n的最小完全平方数 a.问题描述:输入格式、输出格式 b.生成数据 c.构建线性回归模型 d.构建优化器和损失函数 e.模型训练 f.模型验证 小结:先用传统方法人脑解题,写出能算出结果的函数,然后根据这一函数生成训练数据,最后训练出线性回归模型。使用简单的线性变换层组建网络,使用少量数据进行拟合,模型输出能近似预期结果,但还有一定的差距,有很大的提升的空间,感兴趣的开发者可以基于本项目,尝试使用更多的数据、更复杂的网络等。 人脸关键点检测:基于空间注意力SAN与GoogLeNet实现人脸关键点检测并自动添加表情贴纸(链接:https://aistudio.baidu.com/aistudio/projectdetail/1533049?channelType=0&channel=0)。 2、分类任务 图像分类:从论文到代码深入解析带有门控单元的gMLP算法。(链接:https://aistudio.baidu.com/aistudio/projectdetail/2134364) 3、场景任务 目标检测:基于PaddleX的YOLOv3模型快速实现昆虫检测(链接:https://aistudio.baidu.com/aistudio/projectdetail/442375)。 人像分割:基于PaddleX核心分割模型 Deeplabv3+Xcetion65 & HRNet_w18_small_v1 实现人像分割,PaddleX提供了人像分割的预训练模型,可直接使用,当然也可以根据自己的数据做微调(链接:https://paddlex.readthedocs.io/zh_CN/release-1.3/examples/human_segmentation.html)。 文字识别:基于chinese_ocr_db_crnn_mobile实现文字识别,识别图片当中的汉字,该Module是一个超轻量级中文OCR模型,支持直接预测(链接:https://www.paddlepaddle.org.cn/hubdetail?name=chinese_ocr_db_crnn_mobile&en_category=TextRecognition)。 二、模型训练 1.?基于高层API训练模型:通过Model.prepare接口来对训练进行提前的配置准备工作,包括设置模型优化器,Loss计算方法,精度计算方法等。 2.?使用PaddleX训练模型:YOLOv3模型的训练接口示例,函数内置了piecewise学习率衰减策略和momentum优化器。 三、超参优化 2.?手动调整超参数的四大方法:使用提前停止来确定训练的迭代次数,让学习率从高逐渐降低,宽泛策略,小批量数据(mini-batch)大小不必最优。 四、效果展示 2.巧用VisualDL:VisualDL文档:https://ai.baidu.com/ai-doc/AISTUDIO/Dk3e2vxg9#visualdl%E5%B7%A5%E5%85%B7 3.权重可视化:InterpretDL源码:https://github.com/PaddlePaddle/InterpretDL 总结: 2、学会使用SubClass形式组网,科研需要一定要学会用SubClass形式组网。 3、模型训练,超参数的选择有很多讲究,超参的好坏往往会影响模型的最终结果。 4、效果展示十分重要,是一个项目的加分项。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/22 15:12:12- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |