IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【超分辨】FSRCNN模型的Pytorch实现 -> 正文阅读

[人工智能]【超分辨】FSRCNN模型的Pytorch实现

原文地址:Accelerating the Super-Resolution Convolutional Neural Network

SRCNN:超分辨网络SRCNN的Pytorch实现

概述

FSRCNN,即Fast SRCNN,可见这个算法和SRCNN相比应该是在速度上做了优化。

在训练模型的过程中,SRCNN需要先将LR(低分辨率)图片通过双三次插值,变成HR(高分辨率)图片,这个过程随着放大倍数变大而变得十分耗时。

FSRCNN正是着眼于此,取消了双三次插值,代之以 5 × 5 5\times5 5×5的卷积层。剩下的都是常规的加速操作,比如压缩特征层维度、用多层 3 × 3 3\times3 3×3卷积核代替单层 9 × 9 9\times9 9×9卷积。

其激活函数为PReLU,其表达式为

f ( x ) = max ? ( 0 , x ) + a ? min ? ( 0 , x ) f(x)=\max(0,x)+a*\min(0,x) f(x)=max(0,x)+a?min(0,x)

a = 0 a=0 a=0时,PReLU就退化为ReLU。

代价函数和SRCNN相同,皆为均方误差。设 X X X为原图, Y Y Y为LR图像, F ( Y ) F(Y) F(Y)为模型输出的图像,则其损失为

L ( θ ) = 1 n ∑ i = 1 n ∥ F ( Y i ; θ ) ? X i ∥ 2 L(\theta)=\frac{1}{n}\sum^n_{i=1}\Vert F(Y_i;\theta)-X_i\Vert^2 L(θ)=n1?i=1n?F(Yi?;θ)?Xi?2

网络模型

由于没有了插值过程,所以FSRCNN要比SRCNN更加存粹,只需一个神经网络就可以跑完流程,其模型分为5步:

  1. 特征提取:通过 5 × 5 5\times5 5×5的卷积核,将1层数据转为 d d d层。
  2. 降维(shrinking):将 d d d层数据,通过 1 × 1 1\times1 1×1的卷积核降为 s s s层, s ? d s\leqslant d s?d
  3. 匹配(Mapping):用 3 × 3 3\times3 3×3的卷积核,将 s s s层数据再卷成 s s s层。
  4. 放大(Expanding):用 1 × 1 1\times1 1×1的卷积核,将 s s s层数据在展回 d d d层。
  5. 反卷积:通过 9 × 9 9\times9 9×9的卷积核,将 s s s层数据卷回1层。

所以,第一步是 5 × 5 5\times5 5×5卷积核,以及卷积之后的PReLU计算,

import math
from torch import nn

def normNN(N, d, k, p=0):
    NN = nn.Conv2d(N, d, kernel_size=k, padding=p)
    std = math.sqrt(2/d/NN.weight.data[0][0].numel())
    nn.init.normal_(NN.weight.data, mean=0.0, std=std)
    nn.init.zeros_(NN.bias.data)
    return NN

class FSRCNN(nn.Module):
    def __init__(self, scale_factor, 
        N=1, d=56, s=12, m=4):
        super(FSRCNN, self).__init__()
        # 第一组
        nns = [normNN(N, d, 5, 5//2), nn.PReLU(d)]
        nns += [normNN(d, s, 1), nn.PReLU(s)]   #降维
        for _ in range(m):      #匹配
            nns += [normNN(s, s, 3, 3//2), nn.PReLU(s)]
        nns += [nn.Conv2d(s, d, 1), nn.PReLU(d)]    #放大
        self.NN1 = nn.Sequential(*nns)
        # 反卷积层
        self.NN2 = nn.ConvTranspose2d(d, N, 9, scale_factor, 
            9//2, output_padding=scale_factor-1)
        nn.init.normal_(self.NN2.weight.data, 
            mean=0.0, std=0.001)
        nn.init.zeros_(self.NN2.bias.data)
    def forward(self, x):
        x = self.NN1(x)
        x = self.NN2(x)
        return x

其中,nn.init.normal_可通过给定均值和标准差,生成正态分布,填充输入的变量。

最终效果为

请添加图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-05-11 16:27:02  更:2022-05-11 16:28:45 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/4 15:07:47-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码