[人工智能] 李宏毅机器学习-卷积神经网络

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 李宏毅机器学习-卷积神经网络 -> 正文阅读

[人工智能]李宏毅机器学习-卷积神经网络

1.为什么用CNN处理图像

CNN做的事就是简化neural network的架构，用比较少的参数来做影像处理这件事。所以CNN比一般的DNN还要简单的。

为什么可以用比较少的参数可以来做影像处理这件事情

在图片处理中，大部分的pattern其实要比整张的image还要小，对一个neural来说，假设它要知道一个image里面有没有某一个pattern出现，它其实是不需要看整张image，它只要看image的一小部分。
样的pattern在image里面，可能会出现在image不同的部分，但是代表的是同样的含义，它们有同样的形状，可以用同样的neural，同样的参数就可以把patter侦测出来。
我们知道一个image你可以做subsampling，你把一个image的奇数行，偶数列的pixel拿掉，变成原来十分之一的大小，它其实不会影响人对这张image的理解。

2.CNN架构

在这里插入图片描述

卷积（convolution）

在这里插入图片描述

通过filter 1检测出，左上角和左下角出现最大值。同理使用filtr 2对图像做convolution后，可以得到下面的矩阵。

对于彩色图像（RGB）

一个彩色的image就是好几个matrix叠在一起，就是一个立方体。如果要处理彩色image，这时候filter不是一个matrix，filter而是一个立方体。如果今天是RGB表示一个pixel的话，那input就是3*6 *6，那filter就是3 *3 *3。