一、建立评价指标
- 最好是一个指标
- 指标是容易理解的
- 指标的范围最好是在[0,1]之间,最好是线性的。
- 回归问题:均方差mse
- 分类问题:F1分数(good),准确率precision+召回率recall(bad)
- 标题生成:BLEU
二、建立合理的预期
- 深度网络可能达到的评价指标最好的值?(以image captioning为例)
- Image captioning可以理解为三个串行任务 :?
- 目标识别
- 目标动作识别
- 场景理解
- 语言合成
三、数据集
- 测试数据集的数据==训练数据集的数据(风格行为一致)
- 低偏差低方差最好
消除欠拟合(1)
- 增加训练epoch
- 增大batch-size
- 调整激活函数(使用relu)
- 调整优化算法
消除欠拟合(2)
- 增加网络复杂度
增加层数 增加卷积层输出的通道数 增加全连接层的节点数 - 检测训练数据集和测试数据集
增加训练数据的种类,使得训练数据覆盖所有测试数据的特性 使用数据增强
消除过拟合
- 检测训练数据集和测试数据是否有相应的特征
增加训练数据的种类,使得训练数据覆盖所有测试数据的特性 使用数据增强 - 减小网络复杂度
- 增加正则化
L1 regularization L2 regularization ? - 增加drop 层
- 添加batch normalization
|