IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【李宏毅2022 机器学习春】hw2_Classification(strong baseline) -> 正文阅读

[人工智能]【李宏毅2022 机器学习春】hw2_Classification(strong baseline)

实验记录(acc ≈ kaggle评分)

实验配置:

concat_nframes = 19
batch_size = 2048
num_epoch = 50 
learning_rate = 0.0005
scheduler = lr_scheduler.CosineAnnealingLR(optimizer, T_max=10, eta_min=1e-5)
L2 = 1e-4

nn.BatchNorm1d(2048),
nn.Dropout(0.5), // 没有试过不加dropout,会不会过拟合,不加Dropout结果可以告诉我

实验结果:

hidden_layer=6, hidden_dim=1024:0.733225
hidden_layer=2, hidden_dim=1700:0.746941
hidden_layer=3, hidden_dim=2048:0.752439
hidden_layer=6, hidden_dim=input_dim->2048->2048->1024->512->256->output_dim:0.753701(去年的程序,没有用余弦退火学习率 准确率只有0.70左右上不去)

评分标准

在这里插入图片描述
在这里插入图片描述

收获

余弦退火学习率(大杀器啊,可能以后都会用,逃离局部最优值
参考:https://www.cnblogs.com/chouxianyu/p/12573673.html

利用余弦退火学习率,有的学生可能问了,为什么老是余弦退火啊,用李宏毅老师的话,这都是古圣先贤的意思,用就对了,不过我的理解是使用余弦退火的时候可以很直观的看到哪些学习率是比较合适的,这对我们选择正确的学习率参数很有帮助。

更多的学习率改变函数参考pytorch官网的torch.optim下的How to adjust learning rate : https://pytorch.org/docs/stable/optim.html#torch.optim.lr_scheduler.CosineAnnealingWarmRestarts

简单使用讲解:

import torch.optim.lr_scheduler as lr_scheduler // 引包
scheduler = lr_scheduler.CosineAnnealingLR(optimizer, T_max=10, eta_min=1e-5)  // 定义scheduler 
scheduler.step()  // 每一轮之后改变学习率

在这里插入图片描述


用去年strong的程序过不了strong baseline,让我苦思不得解…
今年2022的数据预处理不友好啊,有点慢,不过可以调成总共19帧,去年是11帧已经给定好了。
然后用上 余弦退火学习率 就能从0.70提升到0.75过strong,笑~
最大的收获是:余弦退火学习率

参考资料

李宏毅2022机器学习HW2解析:https://blog.csdn.net/weixin_42369818/article/details/123632053?spm=1001.2014.3001.5502

[LR Scheduler]余弦退火:https://blog.zhujian.life/posts/6eb7f24f.html

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-01 00:02:58  更:2022-04-01 00:04:45 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 12:19:52-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码