IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【mmdetection3d】——自定义运行时配置 -> 正文阅读

[人工智能]【mmdetection3d】——自定义运行时配置

教程 5: 自定义运行时配置

自定义优化器设置

自定义 PyTorch 支持的优化器

我们已经支持使用所有 PyTorch 实现的优化器,且唯一需要修改的地方就是改变配置文件中的 optimizer 字段。
举个例子,如果您想使用 ADAM (注意到这样可能会使性能大幅下降),您可以这样修改:

optimizer = dict(type='Adam', lr=0.0003, weight_decay=0.0001)

为了修改模型的学习率,用户只需要修改优化器配置中的 lr 字段。用户可以根据 PyTorch 的 API 文档 直接设置参数。

自定义并实现优化器

1. 定义新的优化器

一个自定义优化器可以按照如下过程定义:

假设您想要添加一个叫 MyOptimizer 的,拥有参数 abc 的优化器,您需要创建一个叫做 mmdet3d/core/optimizer 的目录。
接下来,应该在目录下某个文件中实现新的优化器,比如 mmdet3d/core/optimizer/my_optimizer.py

from mmcv.runner.optimizer import OPTIMIZERS
from torch.optim import Optimizer


@OPTIMIZERS.register_module()
class MyOptimizer(Optimizer):

    def __init__(self, a, b, c)

2. 将优化器添加到注册器

为了找到上述定义的优化器模块,该模块首先需要被引入主命名空间。有两种方法实现之:

  • 新建 mmdet3d/core/optimizer/__init__.py 文件用于引入。

    新定义的模块应该在 mmdet3d/core/optimizer/__init__.py 中被引入,使得注册器可以找到新模块并注册之:

from .my_optimizer import MyOptimizer

__all__ = ['MyOptimizer']

您也需要通过添加如下语句在 mmdet3d/core/__init__.py 中引入 optimizer

from .optimizer import *

或者在配置中使用 custom_imports 来人工引入新优化器:

custom_imports = dict(imports=['mmdet3d.core.optimizer.my_optimizer'], allow_failed_imports=False)

模块 mmdet3d.core.optimizer.my_optimizer 会在程序伊始被引入,且 MyOptimizer 类在那时会自动被注册。
注意到只有包含 MyOptimizer 类的包应该被引入。
mmdet3d.core.optimizer.my_optimizer.MyOptimizer 不能 被直接引入。

事实上,用户可以在这种引入的方法中使用完全不同的文件目录结构,只要保证根目录能在 PYTHONPATH 中被定位。

3. 在配置文件中指定优化器

接下来您可以在配置文件的 optimizer 字段中使用 MyOptimizer
在配置文件中,优化器在 optimizer 字段中以如下方式定义:

optimizer = dict(type='SGD', lr=0.02, momentum=0.9, weight_decay=0.0001)

为了使用您自己的优化器,该字段可以改为:

optimizer = dict(type='MyOptimizer', a=a_value, b=b_value, c=c_value)

自定义优化器的构造器

部分模型可能会拥有一些参数专属的优化器设置,比如 BatchNorm 层的权重衰减 (weight decay)。
用户可以通过自定义优化器的构造器来对那些细粒度的参数进行调优。

from mmcv.utils import build_from_cfg

from mmcv.runner.optimizer import OPTIMIZER_BUILDERS, OPTIMIZERS
from mmdet.utils import get_root_logger
from .my_optimizer import MyOptimizer


@OPTIMIZER_BUILDERS.register_module()
class MyOptimizerConstructor(object):

    def __init__(self, optimizer_cfg, paramwise_cfg=None):

    def __call__(self, model):

        return my_optimizer

默认优化器构造器在这里实现。这部分代码也可以用作新优化器构造器的模版。

额外的设置

没有在优化器部分实现的技巧应该通过优化器构造器或者钩子来实现 (比如逐参数的学习率设置)。我们列举了一些常用的可以稳定训练过程或者加速训练的设置。我们欢迎提供更多类似设置的 PR 和 issue。

  • 使用梯度裁剪 (gradient clip) 来稳定训练过程

    一些模型依赖梯度裁剪技术来裁剪训练中的梯度,以稳定训练过程。举例如下:

    optimizer_config = dict(
        _delete_=True, grad_clip=dict(max_norm=35, norm_type=2))
    

    如果您的配置继承了一个已经设置了 optimizer_config 的基础配置,那么您可能需要 _delete_=True 字段来覆盖基础配置中无用的设置。详见配置文件的说明文档

  • 使用动量规划器 (momentum scheduler) 来加速模型收敛

    我们支持用动量规划器来根据学习率更改模型的动量,这样可以使模型更快地收敛。
    动量规划器通常和学习率规划器一起使用,比如说,如下配置文件在 3D 检测中被用于加速模型收敛。
    更多细节详见 CyclicLrUpdaterCyclicMomentumUpdater 的实现。

    lr_config = dict(
        policy='cyclic',
        target_ratio=(10, 1e-4),
        cyclic_times=1,
        step_ratio_up=0.4,
    )
    momentum_config = dict(
        policy='cyclic',
        target_ratio=(0.85 / 0.95, 1),
        cyclic_times=1,
        step_ratio_up=0.4,
    )
    

自定义训练规程

默认情况,我们使用阶梯式学习率衰减的 1 倍训练规程。这会调用 MMCV 中的 StepLRHook
我们在这里支持很多其他学习率规划方案,比如余弦退火多项式衰减规程。下面是一些样例:

  • 多项式衰减规程:

    lr_config = dict(policy='poly', power=0.9, min_lr=1e-4, by_epoch=False)
    
  • 余弦退火规程:

    lr_config = dict(
        policy='CosineAnnealing',
        warmup='linear',
        warmup_iters=1000,
        warmup_ratio=1.0 / 10,
        min_lr_ratio=1e-5)
    

自定义工作流

工作流是一个(阶段,epoch 数)的列表,用于指定不同阶段运行顺序和运行的 epoch 数。
默认情况它被设置为:

workflow = [('train', 1)]

这意味着,工作流包括训练 1 个 epoch。
有时候用户可能想要检查一些模型在验证集上的评估指标(比如损失、准确率)。
在这种情况中,我们可以将工作流设置如下:

[('train', 1), ('val', 1)]

这样,就是交替地运行 1 个 epoch 进行训练,1 个 epoch 进行验证。

请注意:

  1. 模型参数在验证期间不会被更新。
  2. 配置文件中,runner 里的 max_epochs 字段只控制训练 epoch 的数量,而不会影响验证工作流。
  3. [('train', 1), ('val', 1)][('train', 1)] 工作流不会改变 EvalHook 的行为,这是因为 EvalHookafter_train_epoch 调用,且验证工作流只会影响通过 after_val_epoch 调用的钩子。因此,[('train', 1), ('val', 1)][('train', 1)] 的唯一区别就是执行器 (runner) 会在每个训练 epoch 之后在验证集上计算损失。

自定义钩子

自定义并实现钩子

1. 实现一个新钩子

存在一些情况下用户可能需要实现新钩子。在版本 v2.3.0 之后,MMDetection 支持自定义训练过程中的钩子 (#3395)。因此用户可以直接在 mmdet 中,或者在其基于 mmdet 的代码库中实现钩子并通过更改训练配置来使用钩子。
在 v2.3.0 之前,用户需要更改代码以使得训练开始之前钩子已经注册完毕。
这里我们给出一个,在 mmdet3d 中创建并使用新钩子的例子。

from mmcv.runner import HOOKS, Hook


@HOOKS.register_module()
class MyHook(Hook):

    def __init__(self, a, b):
        pass

    def before_run(self, runner):
        pass

    def after_run(self, runner):
        pass

    def before_epoch(self, runner):
        pass

    def after_epoch(self, runner):
        pass

    def before_iter(self, runner):
        pass

    def after_iter(self, runner):
        pass

取决于钩子的功能,用户需要指定钩子在每个训练阶段时的行为,具体包括如下阶段:before_runafter_runbefore_epochafter_epochbefore_iter,和 after_iter

2. 注册新钩子

接下来我们需要引入 MyHook。假设新钩子位于文件 mmdet3d/core/utils/my_hook.py 中,有两种方法可以实现之:

  • 更改 mmdet3d/core/utils/__init__.py 来引入之:

    新定义的模块应在 mmdet3d/core/utils/__init__.py 中引入,以使得注册器可以找到新模块并注册之:

from .my_hook import MyHook

__all__ = [..., 'MyHook']

或者在配置中使用 custom_imports 来人为地引入之

custom_imports = dict(imports=['mmdet3d.core.utils.my_hook'], allow_failed_imports=False)

3. 更改配置文件

custom_hooks = [
    dict(type='MyHook', a=a_value, b=b_value)
]

您可以将字段 priority 设置为 'NORMAL' 或者 'HIGHEST',来设置钩子的优先级,如下所示:

custom_hooks = [
    dict(type='MyHook', a=a_value, b=b_value, priority='NORMAL')
]

默认情况,在注册阶段钩子的优先级被设置为 NORMAL

使用 MMCV 中实现的钩子

如果钩子已经在 MMCV 中被实现了,您可以直接通过更改配置文件来使用该钩子:

custom_hooks = [
    dict(type='MyHook', a=a_value, b=b_value, priority='NORMAL')
]

更改默认的运行时钩子

有一些常用的钩子并没有通过 custom_hooks 注册,它们是:

  • 日志配置 (log_config)
  • 检查点配置 (checkpoint_config)
  • 评估 (evaluation)
  • 学习率配置 (lr_config)
  • 优化器配置 (optimizer_config)
  • 动量配置 (momentum_config)

在这些钩子中,只有日志钩子拥有 VERY_LOW 的优先级,其他钩子的优先级均为 NORMAL
上述教程已经涉及了如何更改 optimizer_configmomentum_config,和 lr_config
下面我们展示如何在 log_configcheckpoint_config,和 evaluation 上做文章。

检查点配置

MMCV 执行器会使用 checkpoint_config 来初始化 CheckpointHook

checkpoint_config = dict(interval=1)

用户可以设置 max_keep_ckpts 来保存一定少量的检查点,或者用 save_optimizer 来决定是否保存优化器的状态。更多参数的细节详见这里

日志配置

log_config 将多个日志钩子封装在一起,并允许设置日志记录间隔。现在 MMCV 支持 WandbLoggerHookMlflowLoggerHook,和 TensorboardLoggerHook
更详细的使用方法请移步 MMCV 文档

log_config = dict(
    interval=50,
    hooks=[
        dict(type='TextLoggerHook'),
        dict(type='TensorboardLoggerHook')
    ])

评估配置

evaluation 的配置会被用于初始化 EvalHook
除了 interval 字段,其他参数,比如 metric,会被传递给 dataset.evaluate()

evaluation = dict(interval=1, metric='bbox')
  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-11-09 19:29:17  更:2021-11-09 19:34:04 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 8:05:48-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码