IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Anchorpoints学习笔记: -> 正文阅读

[人工智能]Anchorpoints学习笔记:

Anchor Detr学习笔记:

1.首先介绍下什么叫锚点(Anchor point)

? ??Anchor point就类似一张钉在墙上的相框,但是钉的确不是那么的紧,相框可以围绕着钉子进行旋转,也就是做为变换的支点,类似的还有平移、缩放。这样就实现了图层的旋转与移动。
??懂了Anchor point以后,问题来了—怎么确定Anchor point的位置呢?
??经过一方学习后,我找到了这个答案。在IOS中,anchorPoint点的值是用一种相对bound的比例值来确定的。意思是说,在相框形成的单元坐标左上角、右下角中,AnchorPoint分别为(0,0)、(1,1),同样的就可以得到中心点、左下角和右上角的AnchorPoint为(0.5,0.5), (0,1), (1,0)。
如下图所示:

在这里插入图片描述

? ??(注意:iOS使用左手坐标系,坐标原点在左上角,MacOS使用右手坐标系,原点在左下角)如下图所示:
在这里插入图片描述

以下一张图片对Anchor point的移动进行讲解:

在这里插入图片描述

在我看来这张图的意思大概可以讲解为如下:
??原图(蓝色框)的锚点在(0.5,0.5)处,现在将它的锚点移到(0,0)位置,也就是原图的左上方的点(红色箭头所指位置),就相当于将整张图像”向左上方滑动“直到移动的图像的锚点与原图(0,0)位置重合,滑动后在原图左上方复制一个一模一样大小的视图(橙色框)。

2.再来介绍下什么叫DETR

? ??DETR通过将常见的CNN与transformer架构相结合,直接(并行)预测最终的检测结果。 在训练期间,二分匹配将唯一的预测分配给GT框。 不匹配的预测应产生“无对象”类预测。
? ??DETR的流程大为简化,可以归结如下:Backbone -> Transformer -> detect header。
??其中,Backbone:主干网络,用于对图像进行特征提取,生成对应的feature map后,传递给后面的网络使用。
??Transformer:基于self—attention的模型,一般用于处理图像、语义问题,因为已经分布过一次笔记这里就不多介绍了。详细的可以看:(29条消息) Transformer学习笔记:_风声向寂的博客-CSDN博客
??detect header:后续连接的网络层,主要是服务于detection任务。
??下面给大家举个图片例子:

在这里插入图片描述

3.Anchor Detr

? ??Anchor Detr基于Transformer的目标检测器。在以前基于Transformer的检测器中,目标的查询是一组可学习的embedding。
??然而,每个可学习的embedding都没有明确的意义 (因为是随机初始化的),所以也不能解释它最终将集中在哪里。此外,由于每个对象查询将不会关注特定的区域,所以训练时优化也是比较困难的 。为了解决这些问题,大佬们借鉴了CNN目标检测器中的Anchor Point机制,使得每个查询都基于特定的Anchor Point的,使每个查询都可以集中在Anchor Point附近的目标上。
??此外大佬们还使用了一种轻量级的attention变体(行列解耦注意),减少attention的计算成本。

以下是其结构:

在这里插入图片描述

??以下是大佬们的项目,有兴趣的可以自取:megvii-research/AnchorDETR (github.com)

10.17学习笔记

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-10-18 17:24:05  更:2021-10-18 17:24:34 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 8:33:22-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码