[人工智能] Pytorch中model.train()和model.eval()的作用

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> Pytorch中model.train()和model.eval()的作用 -> 正文阅读

[人工智能]Pytorch中model.train()和model.eval()的作用

我们在使用pytorch训练模型的时候会先加上一句

model.train()

模型训练完做推理时，也会先加上一句

model.eval()

这两句话的作用是告诉模型当前是在训练还是推理阶段。因为我们的模型的某些部分在做训练和推理时的操作是不一样的，如BN层的计算过程，Faster RCNN在训练和推理时预选框的选择等等。
那么这两句话背后是做了什么操作来告诉模型当前阶段是训练还是推理呢？其实train()和eval()方法是在torch的Module类中实现的。源码如下

class Module(object):
    _version = 1

    def __init__(self):
        """
        Initializes internal Module state, shared by both nn.Module and ScriptModule.
        """
        torch._C._log_api_usage_once("python.nn_module")

        self.training = True
        self._parameters = OrderedDict()
        self._buffers = OrderedDict()
        self._backward_hooks = OrderedDict()
        self._forward_hooks = OrderedDict()
        self._forward_pre_hooks = OrderedDict()
        self._state_dict_hooks = OrderedDict()
        self._load_state_dict_pre_hooks = OrderedDict()
        self._modules = OrderedDict()
	......
	......
	......
	......
	......
    def train(self, mode=True):
        r"""Sets the module in training mode.

        This has any effect only on certain modules. See documentations of
        particular modules for details of their behaviors in training/evaluation
        mode, if they are affected, e.g. :class:`Dropout`, :class:`BatchNorm`,
        etc.

        Args:
            mode (bool): whether to set training mode (``True``) or evaluation
                         mode (``False``). Default: ``True``.

        Returns:
            Module: self
        """
        self.training = mode
        for module in self.children():
            module.train(mode)
        return self

    def eval(self):
        r"""Sets the module in evaluation mode.

        This has any effect only on certain modules. See documentations of
        particular modules for details of their behaviors in training/evaluation
        mode, if they are affected, e.g. :class:`Dropout`, :class:`BatchNorm`,
        etc.

        This is equivalent with :meth:`self.train(False) <torch.nn.Module.train>`.

        Returns:
            Module: self
        """
        return self.train(False)

我们可以看到Module类中有定义一个参数training，并初始化为True,

self.training=True

我们自己在写模型网络时，会先继承torch.nn.Module，

class Network(nn.Module):
	"""
	"""

模型搭建完成后，先对模型进行初始化，

model=Network()

此时model就继承了torch.nn.Module，执行model.train()时，实际执行的操作是在Module的train()方法，将模型的参数training设置为True，并且每个子代Module的training设置为True。

    def train(self, mode=True):
        self.training = mode
        for module in self.children():
            module.train(mode)
        return self

执行model.eval()时，实际执行的操作是在Module的eval()方法，eval()通过调用train()，传入False的参数，将training设置为False。

    def eval(self):
        return self.train(False)

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2021-07-16 11:17:35 更:2021-07-16 11:19:59

360图书馆购物三丰科技阅读网日历万年历 2025年8日历

-2025/8/18 22:12:36-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码