| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 详解停车位检测论文:Attentional Graph Neural Network for Parking-slot Detection -> 正文阅读 |
|
[人工智能]详解停车位检测论文:Attentional Graph Neural Network for Parking-slot Detection |
论文链接为:https://arxiv.org/pdf/2104.02576.pdf 项目链接为:https://github.com/Jiaolong/gcn-parking-slot 1. Method1.1 Overview本文提出的
1.2 Graph Feature Encoder标价点检测器输出为
S
×
S
×
3
S\times S\times 3
S×S×3 的特征图,其中通道
3
3
3 包含 标记点特征编码器包含 4 4 4 个卷积层,输出特征图为 S × S × 64 S\times S \times 64 S×S×64。对于检测到的 N N N 个标记点位置 P = ( x , y ) ∈ R N × 2 P=(x,y) \in \mathbb{R}^{N\times 2} P=(x,y)∈RN×2,使用双线性插值计算标记点特征。最终得到标记点特征 F ∈ R N × 64 \mathbf{F} \in \mathbb{R}^{N\times 64} F∈RN×64。这里特征图大小 S = 16 S=16 S=16。 为了增强特征表示,将 其中, f i \mathbf{f}_i fi? 为最初的标记点特征。 1.3 Graph Feature Aggregation融合后的标记点特征集合 V \mathbf{V} V,构造一个全连接的图网络 G = ( V , E ) \mathbf{G}=(\mathbf{V},\mathbf{E}) G=(V,E),其中 V \mathbf{V} V 表示 N N N 个节点 ( x i ) (\mathbf{x}_i) (xi?), E \mathbf{E} E 表示 N × N N \times N N×N 条边。 图神经网络每一层 其中 m E i → i l \mathbf{m}_{E_{i} \rightarrow i}^{l} mEi?→il? 为第 i i i 个节点一阶邻域 E i {E}_i Ei? 聚合的信息,由注意力机制计算得来, [ ? ∥ ? ] [\cdot \| \cdot] [?∥?] 为特征结合操作。 对于每一个图节点特征
x
i
l
\mathbf{x}_i^l
xil?,query,key,value 计算为: 节点 i , j i,j i,j 之间的注意力计算为: α i , j = S o f t m a x ( q i T k j ) \alpha_{i,j}=Softmax(\mathbf{q}_i^{T} \mathbf{k}_j) αi,j?=Softmax(qiT?kj?),则图节点聚合信息为: m E i → i l = ∑ j ∈ E i α i , j k v j \mathbf{m}_{E_{i} \rightarrow i}^{l}=\sum_{j \in E_{i}} \alpha_{i, j}^{k} \mathbf{v}_{j} mEi?→il?=∑j∈Ei??αi,jk?vj?。在本文中,使用多个注意力头,则聚合信息为: m E i → i l = W l ( m E i → i l , 1 ∥ m E i → i l , 2 ∥ ? ∥ m E i → i l , h ) \mathbf{m}_{E_{i} \rightarrow i}^{l}=\mathbf{W}^{l}\left(\mathbf{m}_{E_{i} \rightarrow i}^{l, 1}\left\|\mathbf{m}_{E_{i} \rightarrow i}^{l, 2}\right\| \cdots \| \mathbf{m}_{E_{i} \rightarrow i}^{l, h}\right) mEi?→il?=Wl(mEi?→il,1?∥∥∥?mEi?→il,2?∥∥∥??∥mEi?→il,h?)。 1.4 Entrance Line Discriminator两个图节点特征结合得到一个
1
×
128
1\times 128
1×128 的输入特征,然后输入到线性判别器。最终输出为
K
×
5
K \times 5
K×5 的矩阵,其中
K
=
N
×
N
K=N \times N
K=N×N,表示为标记点对。每一对标记点对包含5个元素:
x
1
,
y
1
,
x
2
,
y
2
,
t
x_1,y_1,x_2,y_2,t
x1?,y1?,x2?,y2?,t。其中
(
x
1
,
x
2
,
x
2
,
y
2
)
(x_1,x_2,x_2,y_2)
(x1?,x2?,x2?,y2?) 为 整个损失函数为: 其中
2.Experimental Results and Discussion2.1 Datastes & Setting
S g \mathbf{S}_g Sg? 表示为停车位真值集合, S d \mathbf{S}_d Sd? 为检测结果集合,如果满足下列条件,则检测结果为真阳性。 ∥ ( p 1 g ? p 1 d , p 2 g ? p 2 d ) ∥ 2 < 10 \left\|\left(\mathbf{p}_{1}^{g}-\mathbf{p}_{1}^{d}, \mathbf{p}_{2}^{g}-\mathbf{p}_{2}^{d}\right)\right\|_{2}<10 ∥∥?(p1g??p1d?,p2g??p2d?)∥∥?2?<10 2.2 Results and Discussions在 2.3 Ablation study下面是一些对照实验结果,比较了使用不同特征网络的检测性能和时间消耗,位置编码器、图神经网络层数和注意力头个数影响,以及损失函数权重影响。 从中可以看到,标记点损失权重对最终影响是比较大的;不过在 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/1 10:18:31- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |