[人工智能] Xception结构讲解（Tensorflow-2.6.0实现结构）

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> Xception结构讲解（Tensorflow-2.6.0实现结构） -> 正文阅读

[人工智能]Xception结构讲解（Tensorflow-2.6.0实现结构）

文章目录

1.前言

1.随着图像分类的准确率不断提高，网络的深度越来越深，图像分类的错误率也越来越低，从2012的AlexNet，2013年的ZFNet，2014年的GoogLeNet，再到后面2015年的ResNet，准确率已经超过了人类的水平，所以单纯从准确率方面考虑的话已经很难提升了；开始从其他方面考虑，比如参数量和计算量，软硬件协同。

2.深度可分离卷积和普通卷积

每一个卷积核对应一个输入通道进行卷积，最后将所有经过卷积之后的结果堆叠起来得到最后的feature map，这样只处理长宽方向的信息。最后使用1x1的卷积处理跨通道的空间信息。

（1）普通的卷积操作（standard convolution）

在这里插入图片描述
标准卷积的参数量和计算量的计算公式：
输入卷积：Win * Hin * Cin
卷积核：k * k
输出卷积：Wout * Hout * Cout
参数量：（即卷积核的参数）
k * k * Cin * Cout
或者：(k * k * Cin + 1) * Cout （包括偏置bias）
计算量：
k * k * Cin * Wout * Hout * Cout

（2）深度可分离卷积(depthwise convolution)

在这里插入图片描述
xception中的深度可分离卷积是先使用1x1卷积进行扩通道卷积，再使用深度可分离卷积。
如下图所示：

而原始的深度可分离卷积：

链接：
https://towardsdatascience.com/review-xception-with-depthwise-separable-convolution-better-than-inception-v3-image-dc967dd42568
深度可分离卷积的参数量和计算量的计算公式：
输入卷积：Win * Hin * Cin
卷积核：k * k
输出卷积：Wout * Hout * Cin
参数量：
k * k * Cin
计算量：
k * k * Cin * Wout * Hout

（3）点卷积(pointwise convolution)——1x1卷积

在这里插入图片描述
参考博文：
https://blog.csdn.net/kangdi7547/article/details/117925389
注：
深度可分离卷积和普通卷积的区别：
Depthwise ：不同的通道使用不同的卷积核进行卷积，也就是使用不同的卷积核来提取特征（一个kernel处理所有的channel）。
Pointwise：标准的1x1卷积操作，kernel=[1,1]（一个kernel处理一个channel）。
标准卷积（standard convolutions）和点卷积（pointwise convolution）之间的区别是：
点卷积采用的是1x1的卷积方式。

3.对inceptionV3模块进行改进

（1）inceptionV3中的原始模块

在这里插入图片描述

（2）第一层简化

在这里插入图片描述

（3）第二层简化

在这里插入图片描述

（4）最后的简化

在这里插入图片描述
注：每个3x3卷积分别处理不同通道，通道间互不重合。

4.Xception整体网络结构

在这里插入图片描述
注：Xception包含三个部分：输入部分，中间部分和结尾部分；其中所有卷积层和可分离卷积层后面都使用Batch Normalization处理，所有的可分离卷积层使用一个深度乘数1（深度方向并不进行扩充）。

5.实验结果对比（补充）

（1）深度可分离卷积中激活函数使用问题

在这里插入图片描述
注：作者在论文中提到在使用深度卷积（depthwise convolutions）之前和点卷积（pointwise convolutions）之后不要使用激活函数效果更好。

（2）在Imagenet数据集上训练的结果

在这里插入图片描述
注：从图中可以看到，在Imagenet数据集上，Xception比Inception-V3收敛的更快，效果也更好。

（3）在JTF数据集上训练的结果（不使用全连接层）

在这里插入图片描述
注：从图中可以看到，在JFT数据集上并且都不使用全连接层的情况下，Xception同样比Inception-V3收敛的更快，效果也更好。

（4）在JTF数据集上训练的结果（使用全连接层）

在这里插入图片描述
从图中可以看到，在JFT数据集上并且都使用全连接层的情况下，Xception还是同样比Inception-V3收敛的更快，效果也更好。但是相比于不使用全连接层，使用全连接层之后它们都收敛的会慢一点，同时在最后可以看到Xception的MAP上升的空间更大（相对于不使用全连接层）。
当然，上面的这些效果对比都是在Xception和Inception-V3相当的情况下。
在这里插入图片描述

（5）总体效果对比

在这里插入图片描述

（6）使用残差和不使用残差的效果

使用残差和不使用残差，使用残差的效果更好，收敛的更快（差距也非常的大）。

6.Tensorflow-2.6.0实现结构

import os
import keras
import numpy as np
import tensorflow as tf
from tensorflow.keras import models
from tensorflow.keras import layers
from tensorflow.keras.models import Model

class Xception(tf.keras.Model):
    def __init__(self):
        super(Xception, self).__init__()
        #Entry flow
        self.conv1=layers.Conv2D(32,kernel_size=[3,3],strides=[2,2],padding='same')
        self.conv1batch=layers.BatchNormalization()
        self.conv1relu=layers.Activation('relu')

        self.conv2=layers.Conv2D(64,kernel_size=[3,3],strides=[1,1],padding='same')
        self.conv2batch=layers.BatchNormalization()
        self.conv2relu=layers.Activation('relu')

        self.DepthSparaconv1=layers.SeparableConv2D(128,kernel_size=[3,3],strides=[1,1],padding='same')
        self.DepthSparaconv1relu=layers.Activation('relu')

        self.DepthSparaconv2=layers.SeparableConv2D(128,kernel_size=[3,3],strides=[1,1],padding='same')
        self.maxpool1=layers.MaxPool2D(pool_size=[3,3],strides=[2,2],padding='same')

        self.DepthSparaconv3relu = layers.Activation('relu')
        self.DepthSparaconv3 = layers.SeparableConv2D(256, kernel_size=[3, 3], strides=[1, 1], padding='same')

        self.DepthSparaconv4relu = layers.Activation('relu')
        self.DepthSparaconv4 = layers.SeparableConv2D(256, kernel_size=[3, 3], strides=[1, 1], padding='same')
        self.maxpool2 = layers.MaxPool2D(pool_size=[3, 3], strides=[2, 2], padding='same')

        self.DepthSparaconv5relu = layers.Activation('relu')
        self.DepthSparaconv5 = layers.SeparableConv2D(728, kernel_size=[3, 3], strides=[1, 1], padding='same')

        self.DepthSparaconv6relu = layers.Activation('relu')
        self.DepthSparaconv6 = layers.SeparableConv2D(728, kernel_size=[3, 3], strides=[1, 1], padding='same')
        self.maxpool3 = layers.MaxPool2D(pool_size=[3, 3], strides=[2, 2], padding='same')

        #Middle Flow
        self.DepthSparaconv7relu = layers.Activation('relu')
        self.DepthSparaconv7 = layers.SeparableConv2D(728, kernel_size=[3, 3], strides=[1, 1], padding='same')

        self.DepthSparaconv8relu = layers.Activation('relu')
        self.DepthSparaconv8 = layers.SeparableConv2D(728, kernel_size=[3, 3], strides=[1, 1], padding='same')

        self.DepthSparaconv9relu = layers.Activation('relu')
        self.DepthSparaconv9 = layers.SeparableConv2D(728, kernel_size=[3, 3], strides=[1, 1], padding='same')

        #Exit Flow
        self.DepthSparaconv10relu = layers.Activation('relu')
        self.DepthSparaconv10 = layers.SeparableConv2D(728, kernel_size=[3, 3], strides=[1, 1], padding='same')

        self.DepthSparaconv11relu = layers.Activation('relu')
        self.DepthSparaconv11 = layers.SeparableConv2D(1024, kernel_size=[3, 3], strides=[1, 1], padding='same')

        self.maxpool4 = layers.MaxPool2D(pool_size=[3, 3], strides=[2, 2], padding='same')

        self.DepthSparaconv12relu = layers.Activation('relu')
        self.DepthSparaconv12 = layers.SeparableConv2D(1536, kernel_size=[3, 3], strides=[1, 1], padding='same')

        self.DepthSparaconv13relu = layers.Activation('relu')
        self.DepthSparaconv13 = layers.SeparableConv2D(2048, kernel_size=[3, 3], strides=[1, 1], padding='same')

        self.avgpool=layers.GlobalAveragePooling2D()

        self.dense=layers.Dense(2048)
        self.logistic=layers.Activation('softmax')

    def call(self,inputs,training=None):
        #Entry Flow
        print('feature.shape: {}'.format(np.shape(inputs)))
        x=self.conv1(inputs)
        x=self.conv1batch(x)
        x=self.conv1relu(x)
        x=self.conv2(x)
        x=self.conv2batch(x)
        x=self.conv2relu(x)

        x3=self.DepthSparaconv1(x)
        x3=self.DepthSparaconv1relu(x3)
        x3=self.DepthSparaconv2(x3)
        x3=self.maxpool1(x3)

        x=layers.Conv2D(128,kernel_size=[1,1],strides=[2,2],padding='same')(x)
        x4=tf.add(x,x3)

        x5 = self.DepthSparaconv3relu(x4)
        x5=self.DepthSparaconv3(x5)
        x5 = self.DepthSparaconv4relu(x5)
        x5=self.DepthSparaconv4(x5)
        x5=self.maxpool2(x5)

        x6 = layers.Conv2D(256, kernel_size=[1, 1], strides=[2, 2], padding='same')(x4)
        x7 = tf.add(x5, x6)

        x8 = self.DepthSparaconv5relu(x7)
        x8 = self.DepthSparaconv5(x8)
        x8 = self.DepthSparaconv6relu(x8)
        x8 = self.DepthSparaconv6(x8)
        x8 = self.maxpool2(x8)

        x9 = layers.Conv2D(728, kernel_size=[1, 1], strides=[2, 2], padding='same')(x7)
        x10 = tf.add(x9, x8)

        #Middle Flow
        print('feature.shape: {}'.format(np.shape(x10)))
        x11 = self.DepthSparaconv7relu(x10)
        x11 = self.DepthSparaconv7(x11)
        x11 = self.DepthSparaconv8relu(x11)
        x11 = self.DepthSparaconv8(x11)
        x11 = self.DepthSparaconv9relu(x11)
        x11 = self.DepthSparaconv9(x11)

        x12 = layers.Conv2D(728, kernel_size=[1, 1], strides=[1,1], padding='same')(x10)
        x13 = tf.add(x12, x11)

        #Exit Flow
        print('feature.shape: {}'.format(np.shape(x13)))
        x14 = self.DepthSparaconv10relu(x13)
        x14 = self.DepthSparaconv10(x14)
        x14 = self.DepthSparaconv11relu(x14)
        x14 = self.DepthSparaconv11(x14)
        x14 = self.maxpool2(x14)

        x15 = layers.Conv2D(1024, kernel_size=[1, 1], strides=[2, 2], padding='same')(x13)
        x16 = tf.add(x15, x14)

        x_out=self.DepthSparaconv12(x16)
        x_out=self.DepthSparaconv12relu(x_out)
        x_out = self.DepthSparaconv13(x_out)
        x_out = self.DepthSparaconv13relu(x_out)

        x_out=self.avgpool(x_out)
        x_out=self.dense(x_out)
        x_out=self.logistic(x_out)

        return x_out

model_xception=Xception()
model_xception.build(input_shape=(None,299,299,3))
model_xception.summary()



if __name__ == '__main__':
    print('pycharm')