IT数码购物网址头条软件日历阅读图书馆

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放器↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 【李宏毅2022 机器学习春】hw2_Classification（strong baseline） -> 正文阅读

[人工智能]【李宏毅2022 机器学习春】hw2_Classification（strong baseline）

文章目录

实验记录（acc ≈ kaggle评分）
评分标准
收获
参考资料

实验记录（acc ≈ kaggle评分）

实验配置：

concat_nframes = 19
batch_size = 2048
num_epoch = 50 
learning_rate = 0.0005
scheduler = lr_scheduler.CosineAnnealingLR(optimizer, T_max=10, eta_min=1e-5)
L2 = 1e-4

nn.BatchNorm1d(2048),
nn.Dropout(0.5), // 没有试过不加dropout，会不会过拟合，不加Dropout结果可以告诉我

实验结果：

hidden_layer=6, hidden_dim=1024：0.733225
hidden_layer=2, hidden_dim=1700：0.746941
hidden_layer=3, hidden_dim=2048：0.752439
hidden_layer=6, hidden_dim=input_dim->2048->2048->1024->512->256->output_dim：0.753701（去年的程序，没有用余弦退火学习率准确率只有0.70左右上不去）

评分标准

在这里插入图片描述

收获

余弦退火学习率（大杀器啊，可能以后都会用，逃离局部最优值）
参考：https://www.cnblogs.com/chouxianyu/p/12573673.html

利用余弦退火学习率，有的学生可能问了，为什么老是余弦退火啊，用李宏毅老师的话，这都是古圣先贤的意思，用就对了，不过我的理解是使用余弦退火的时候可以很直观的看到哪些学习率是比较合适的，这对我们选择正确的学习率参数很有帮助。

更多的学习率改变函数参考pytorch官网的torch.optim下的How to adjust learning rate : https://pytorch.org/docs/stable/optim.html#torch.optim.lr_scheduler.CosineAnnealingWarmRestarts

简单使用讲解：

import torch.optim.lr_scheduler as lr_scheduler // 引包
scheduler = lr_scheduler.CosineAnnealingLR(optimizer, T_max=10, eta_min=1e-5)  // 定义scheduler 
scheduler.step()  // 每一轮之后改变学习率

在这里插入图片描述

用去年strong的程序过不了strong baseline，让我苦思不得解…
今年2022的数据预处理不友好啊，有点慢，不过可以调成总共19帧，去年是11帧已经给定好了。
然后用上余弦退火学习率就能从0.70提升到0.75过strong，笑~
最大的收获是：余弦退火学习率

参考资料

李宏毅2022机器学习HW2解析：https://blog.csdn.net/weixin_42369818/article/details/123632053?spm=1001.2014.3001.5502

[LR Scheduler]余弦退火：https://blog.zhujian.life/posts/6eb7f24f.html

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

上一篇文章下一篇文章查看所有文章

加:2022-04-01 00:02:58 更:2022-04-01 00:04:45

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

360图书馆购物三丰科技阅读网日历万年历 2026年3日历

-2026/3/8 15:32:54-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码