感知损失

图像转换问题（image transformation tasks），输入一副图像转换成另一幅图像输出。现有方法来解决的图像转换问题，往往以监督训练的方式，训练一个前向传播的网络，利用的就是图像像素级之间的误差。这种方法在测试的时候非常有效，因为仅仅需要一次前向传播即可。但是，像素级的误差没有捕获输出和ground-truth图像之间的感知区别（perceptual differences）。

高质量的图像可以通过定义和优化perceptual loss函数来生成，该损失函数基于使用预训练好的网络提供的高层的特征。

观点：不仅仅在输入输出风格相似，在特征上面也应该具有相似性。

获取Vgg三层感知特征

import torch
from torchvision import models
from torch import nn

class Vgg19(nn.Module):
    def __init__(self,requires_grad=False):
        super(Vgg19, self).__init__()
        self.vgg = models.vgg19(pretrained=True).features
        self.slice1 = nn.Sequential()
        self.slice2 = nn.Sequential()
        self.slice3 = nn.Sequential()

        for x in range(7):
            self.slice1.add_module(str(x),self.vgg[x])
        for x in range(7,21):
            self.slice2.add_module(str(x),self.vgg[x])
        for x in range(21,30):
            self.slice3.add_module(str(x),self.vgg[x])
        if not requires_grad:
            for param in self.parameters():
                param.requires_grad = False

    def forward(self,x):
        h_relu1 = self.slice1(x)
        h_relu2 = self.slice2(h_relu1)
        h_relu3 = self.slice3(h_relu2)


        return [h_relu1,h_relu2,h_relu3]

if __name__ == '__main__':
    model = Vgg19()
    x = torch.randn(1,3,224,224)
    y1,y2,y3 = model(x)
    print(y1.shape)
    print(y2.shape)
    print(y3.shape)

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2021-12-05 12:02:52 更:2021-12-05 12:05:04

360图书馆购物三丰科技阅读网日历万年历 2026年5日历

-2026/5/4 4:34:51-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码