一。toch.nn.CELoss 最近在使用该loss的时候遇到了如下三个问题。
- One-hot问题。
RuntimeError: multi-target not supported at /opt/conda/conda-bld/pytorch_1587428398394/work/aten/src/THCUNN/generic/ClassNLLCriterion.cu:18 参考此篇博客.这是因为CEloss期望的真值输入不能是one-hot形式的,打印一下原本的预测值和真值维度、部分数据如下:
pred shape: torch.Size([128, 10])
target shape: torch.Size([128, 10])
pred: tensor([ -1.8647, 11.9629, -8.9586, -4.3062, -2.7667, 2.8557, -1.5226,-12.8641, 3.2789, 0.8572], device='cuda:0', grad_fn=<SelectBackward>)
target: tensor([0., 0., 0., 0., 1., 0., 0., 0., 0., 0.], device='cuda:0')
CELoss在内部运算过程中会自动进行one-hot编码,所以,这里target中对应维度应该是【128, 1】, 具体到上述打印中的例子, 应该就是单维张量tensor(4, device='cuda:0') 。 2. 数据类型问题
RuntimeError: Expected object of scalar type Long but got scalar type Float for argument
nn.CELoss(pred, target) 其中的第二参数target,其数据类型必须是long类型,如果自己构造的Dataset中的__getitem__() 返回的是其他类型比如float,就会报错。 3. 数据归一化问题。和softmax相关 nn.CELoss(pred, target) 内涵了对pred的softmax操作,因此输入的pred,不需要也不应该再传入softmax层。再补充一下softmax的作用,就是将pred中(-
∞
\infty
∞, +
∞
\infty
∞)的数据归一化到(0, 1),再配合torch.argmax 就可以获取概率最大值对应的类别。
|