[人工智能] 论文阅读：GPS-Net：Graph Property Sensing Network for Scene Graph Generation(CVPR20)+对focal loss的一些理解

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 论文阅读：GPS-Net：Graph Property Sensing Network for Scene Graph Generation(CVPR20)+对focal loss的一些理解 -> 正文阅读

[人工智能]论文阅读：GPS-Net：Graph Property Sensing Network for Scene Graph Generation(CVPR20)+对focal loss的一些理解

在这里插入图片描述
左边的目标检测就不说了，直接看中间的GPS-Net

1.DMP(Direction-Aware Message Passing)
方向敏感的消息传递
在这里插入图片描述
其中：
xi和xj是结点特征，视觉特征、物体分类置信度、空间特征cat在一起，再映射到512维
uij是i和j的union box的特征
然后eij做正则化得到αij，并把αij和αji叠起来，如下式所示
Ni的意思是结点i的邻接结点
在这里插入图片描述
以上是下面DMP示意图的绿色部分，即方向敏感的上下文建模
下面是橙色部分，即Transformer层

2.NPS-loss(Node Property Sensitive Loss)
结点优先度敏感loss
参照的是focal loss，我个人对这个focal loss是这样理解的：
举个例子，如果一个样本是正样本(gt=1)，且模型预测的概率是0.9(pt=0.9)，从直觉上理解，这个样本就是容易分类的，那么1-pt=0.1，log前面的系数(0.1的γ次方)就是一个很小的数，这代表这个容易分类的样本不占loss太大的权重，不用重点关注；
如果还是这个样本(gt=1)，但是模型预测的概率只有0.1，那么从直觉上讲，这个样本就属于难分类的样本，1-pt=0.9，那么它的权重就变大了(0.9的γ次方)，也就是所谓的“更关注难分类的样本”
在这里插入图片描述
回到论文中的NPS-Loss，首先计算θi，即结点i的优先度，ti是结点i所在的三元组数量，T是这张图片总共含有的三元组数量

θi越大，说明这个结点优先度越高，但是γ(θi)越小，因为优先度高的结点是易分类样本；优先度低的结点是难分类样本，γ会更大一些
在这里插入图片描述
下面这个式子就是focal loss了

注：NPS-Loss只用于物体分类