IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> DMPR-PS论文详解 -> 正文阅读

[人工智能]DMPR-PS论文详解

部分参考:DMPR-PS论文简读_海里的羊的博客-CSDN博客

论文名称:DMPR-PS: A PARKING-SLOT DETECTION APPROACH BASED ON DIRECTIONAL MARKING-POINT REGRESSION

摘要

自动泊车系统在自动驾驶中发挥着重要作用,其关键问题之一是停车槽检测。这一领域以前的研究大多是基于为通用目的而设计的现成模型,这些模型在解决特定问题方面有各种局限性。本文提出了一种利用定向标记点回归的停车槽检测方法,即DMPR-PS。DMPR-PS没有使用了多个现成的模型,而是使用了一种新的基于CNN的模型,专门为方向标记点回归设计。给定一个环绕视图图像I,该模型预测了I上每个标记点的位置、形状和方向。从标记点,停车场上,我可以很容易地推断出使用几何规则。DMPR-PS优于基准数据集上ms最先进的竞争对手,精度为99.42%,召回率为99.37%,同时在英伟达泰坦Xp上实现了每帧12ms的实时检测速度。

DIRECTIONAL MARKING-POINT(本章的基础知识点***重要)

定向标记点实际上是一种以标记点及其邻域为特征的局部图像模式。它有三个属性,位置、形状和方向。

Position。如上所述,标记点是标记线的连接点。然而,严格地说,标记线是具有一定宽度的线形标记。两条相交的标记线形成了一个方形的结区域。
在这里插入图片描述

在这里,我们定义了一个方向标记点的位置,作为这个交叉点区域的中心。

Shape.根据标记点图案的形状,各种标记点可分为T形标记点和L形标记点。如图所示。2、T形标记点的图案形状类似于字母“T”,而L形标记点的图案形状类似于字母“L”。

Orientation。由于t形标记点的图案是对称的,因此我们将其方向定义为沿对称轴的方向。至于l形标记点图案,我们将其方向定义为顺时针旋转90?后沿标记线与其他标记线重叠的方向。方向的插图如图中的红色箭头。2

基于上述定义,方向标记点可以用四维向量来表示:
在这里插入图片描述
其中(x、y)表示位置,s是表示图案形状的二进制值,θ表示极坐标系下图案方向的角坐标。

算法主要划分为三个部分:1、数据标注以及数据预处理;2、模型训练及推理;3、后处理;

1、数据标注以及数据预处理;

2、模型训练及推理;

????????为了实现定向标记点的检测,我们提出了一种新的基于CNN的多属性回归模型,它具有专门针对定向标记点设计的回归目标。这种回归模型在上下文中被称为DMPR。

????????给定一个环绕视图图像I,DMPR将我分割成一个S×S图像网格,并使用CNN提取一个S×S×N特征地图。然后在反向传播期间,分配S×S×N特征图中的每个N维向量来执行进入S×S图像网格中相应单元的方向标记点的回归。

????????在我们的模型中,n维向量实际上由6个元素组成:cx、cy,s,cosθ、sinθ和置信度c。置信度预测了一个标记点落入该网格单元的概率。(cx、cy)预测标记点到网格单元格边界的位置。和s预测了方向标记点的形状。我们的模型没有直接预测θ,而是预测了θ的两个三角值,因为θ和sinθ,因为后者在实现中更健壮。基于cosθ和sinθ,可以直接推导出θ。

????????在回归目标定义后,损失函数被去细化为预测和地面事实之间的平方误差之和,并表示为以下方程式:
在这里插入图片描述

????????下标i表示S×S网格的单元格索引,用?表示的符号表示预测的相应基本事实。运算符i表示一个标记点是否落入单元格i中,这意味着我们只有在有一个标记点落入该网格单元格中时,才能惩罚单元格i的标记点属性误差。

????????在DMPR中使用的神经网络的体系结构主要是根据当前对象检测框架的建议以及这一领域的常识来设计的。表1显示了该神经网络的配置。使用具有1×1压缩卷积和3×3扩展卷积的瓶颈块作为我们网络的基本构建块。

?

3、后处理;

?

?

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-02-26 11:31:25  更:2022-02-26 11:34:22 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 3:19:30-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码