| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 游戏开发 -> 深度学习的超参数调整 -> 正文阅读 |
|
[游戏开发]深度学习的超参数调整 |
在深度学习中,超参数有很多种,比如:网络宽度(层宽)、深度(层数),链接方式、损失函数、学习率、批样本数量、优化器等等。对于一个工作来说,对其一一调整是非常浪费时间的,并且也不符合实际。因此我们需要对每个超参数对结果的影响有一个大致了解。
超参数调整
概念
什么是超参数?
神经网络中有哪些超参数?
为什么优化超参数?
超参数的重要性?
合适的超参数范围?
方法
手动调整超参数
如何高效低调试模型?
学习率调整策略?
极端batch_size下如何调整模型?
模型微调有哪些?
特殊场景下的调参
目标检测
使用预训练模型的优劣?
如何从零训练检测器?
GAN
如何改善GAN的性能?
自动调整超参数
什么是AUTOML?
自动超参数搜索方法有哪些?
神经架构搜索?
为什么卷积核设计尺寸为奇数?
权重共享的形式有哪些,为什么要权重共享?
NASNet的设计策略是什么?
参数和超参数的区别参数:由数据自行决定其大小和趋势,单个参数一般对模型结果影响不大。 有哪些超参数超参数通常分为三类:网格参数、优化参数、正则化参数
调整这些参数主要是寻找最优解和正则化之间的关系。网格模型优化调整的目的为了找到全局最优解,而正则项又希望尽量拟合到最优。两者通常情况下,存在一定的对立,但是二者目标一致,即最小化期望风险。最优解用来增加模型复杂度,正则项用来约束模型复杂度。 超参数重要顺序
部分超参数如何影响模型性能
部分超参数合适范围
数据的重要性有一种说法,如果数据预处理的很好,那么你的深度学习就成功了一半了。数据才是模型的根本,如果有一批质量优秀的数据,或者说你能将数据质量处理的很好的时候,往往比挑选或者设计模型的收益来的更大。数据预处理步骤:
学习率调整学习率是深度学习超参数调整中的一个最重要的参数。学习率过大或者过小都对模型的训练有很大的影响。
一个比较好的解决方案是,对学习率进行衰减或增大。tensorflow内置的学习率衰减法,主要有如下方法:
调用方法:
如果使用优化器,可以这样调用:
batch size的设置极端批样本数量,即batch size=1或者batch size=6000,由于显卡的原因,一般情况下batch size会被设置为很小的值(batch size太大会导致显存不足)。针对梯度不稳定的问题,通常不会太致命,若训练中发现梯度不稳定导致性能的严重降低时可采用累计梯度的策略,即每次计算完不反向更新,而是累计多次的误差后进行一次更新,这是一种在内存有限情况下实现有效梯度更新的一个策略。batch size过小通常对batchnorm的影响是最大的,若网络模型中存在batchnorm,batch size若只为1或者2时会对训练结果产生非常大的影响。这时通常有两种策略,一、若模型使用了预训练网络,可冻结预训练网络中batchnorm的模型参数,有效降低batch size引起的统计量变化的影响。二、在网络不是过深或者过于复杂时可直接移除batchnorm或者使用groupnorm代替batchnorm,前者不多阐释,后者是有FAIR提出的一种用于减少batch对batchnorm影响,其主要策略是先将特征在通道上进行分组,然后在组内进行归一化。即归一化操作上完全与batch size无关。这种groupnorm的策略被证实在极小批量网络训练上能达到较优秀的性能。当然这里也引入里group这个超参数,一般情况下建议不宜取group为1或者各通道单独为组的group数量,可结合实际网络稍加调试。 参考:超参数调整 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/17 0:52:07- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |