[人工智能] 百度飞浆图像分割课程笔记11：实例分割 Mask R-CNN [ICCV 2017]

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 百度飞浆图像分割课程笔记11：实例分割 Mask R-CNN [ICCV 2017] -> 正文阅读

[人工智能]百度飞浆图像分割课程笔记11：实例分割 Mask R-CNN [ICCV 2017]

Mask R-CNN框架
在这里插入图片描述
目的：检测图像中的对象object（bounding box），同时为每个实例生成高质量的分割mask（框中哪个像素属于物体，哪个像素属于背景）

第一阶段(RPN)：通过RPN网络提取候选框（哪些区域可能是物体）
第二阶段：对于选取出来的候选框，通过RoIAlign或者RoIPooling操作得到固定大小的feature map（包括当前物体的一些信息），通过feature map来预测类别或者bounding box以及mask（mask只对正样本做）

Mask R-CNN主要组件
在这里插入图片描述
Region Proposal Network（区域建议网络）

目的：图片通过backbone得到feature map，在feature map上预测哪些地方有可能出现proposal

主要步骤：采用滑窗机制，在feature map每个点去预测多个anchor，通常根据不同长宽比设置9个anchor，然后计算anchor相对每个点代表的物体(或者包围的物体)的一个偏移量(x,y,w,h)，为4k coordinates。同时预测每个proposal是正样本和负样本的分数为多少，所以为2k scores。

具体实现细节参考NIPS2015发表的文章Faster R-CNN：https://proceedings.neurips.cc/paper/2015/file/14bfa6bb14875e45bba028a21ed38046-Paper.pdf

Feature Pyramid Network（特征金字塔网络）
在这里插入图片描述
用resnet101层网络提取特征。得到不同尺度的特征
从低分辨率往高分辨做渐进式的融合，使得每一层的feature