- 计算机视觉应用场景
- 图像分类(用于识别图像中物体的类别)
-
- 目标检测(用于检测图像中每个物体的类别,并准确标出他们的位置)
- 语义分割(用于标出图像中每个像素点所属的类别,属于同一类的像素点用一个颜色标记)
- 实例分割(标出物体位置的同时,标注出物体的外形轮廓)
- ?
?
- CNN解决的问题
- CNN卷积神经网络是一种专门用来处理具有类似网格结构的数据神经网络
- 在CNN出现之前,图像对于人工智能来说是一个难题,原因有2;
- 1.图像需要处理的数据量太大,导致成本很高,效率很低
- 2.图像在数字化的过程中很难保留原有的特征,导致图像处理的准确率不高
- CNN是一种专门用来处理具有类似网格结构的
- CNN五层网络结构
- 卷积层/CONV layer(提取图像中的局部特征)
- 卷积层被称为过滤器(filter)或者内核(kernel)或卷积核
- 对输入图像和滤波矩阵(恒定的滤波器filter)做内积(逐个元素相乘再求和)的操作就是卷积,也是卷积圣神经网络的名字来源
- 1.数据输入层
- 2.卷积层
- 激活层
- 将当前特征空间映射转换到另一个空间,让数据能更好被分类
- 池化层
- 最大池化
- 目的
- 缩小最后全连接层中节点的个数,减少整个神经网络参数
- 池化层相比卷积层可以更有效的降低数据维度,这么做不但可以大大减少运算量,还可以有效的避免过拟合。
- 全连接层
- 全连接层类似传统神经网络的部分,用来输出想要的结果。
|