IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 论文精读4:Where am I looking at? Joint Location and Orientation Estimation by Cross-View Matching -> 正文阅读

[人工智能]论文精读4:Where am I looking at? Joint Location and Orientation Estimation by Cross-View Matching

Where am I looking at? Joint Location and Orientation Estimation by Cross-View Matching


  • Where am I looking at? Joint Location and Orientation Estimation by Cross-View Matching

  • 时间

    • 2020 CVPR
  • 作者

    • Shi Yujiao
  • idea

    • 这里面提到的,这个领域的最大的问题

      • 就是巨大的视角差异,不同的视角之间的,包括外观和物体的位置的区别

      • 方向如果不确定,那么就会引起地理位置上的模糊并且加大了搜寻的范围

      • 标准的相机是有限的视角,那么就是减少了地域图片的辨别能力

    • 两个值得注意的点

      • (i)图像中的水平线(平行于方位轴)具有近似恒定的深度,因此对应于航空图像中的同心圆;

      • (ii)图像中的垂直线深度随y坐标增加,因此对应于航空图像中的径向线。

      • 简单来说,就是水平线,横着的线,在空域里是一个圆,然后竖着的线,就是 radial line 经向线,类似下面这个,就是经线纬线

      • 然后他用了一个及坐标转换

    • 部署了一个two - stream CNN 来学习一些联系,提出了一个DSM 模块,可以来实现这个目标,具体来说,就是计算了空地特征之间的关系

  • Contribution

    • 无论Field of View 如何,第一种可以估计位置和朝向的,第一个同时考虑location和orientation的方法

    • 提出了Dynamic Similarity Matching module去计算feature的相似度,从而得到ground images的orientation

    • achieves significant performance improvements

  • 一些相关的

    • Liu & Li

      • 朝向提供了一些重要的线索,可以用来决定地面图像的位置
  • 理论细节

    • 流程图

      • 如上图所示,整个方法的流程主要分为3个部分。首先第①部分,本论文利用Polar Transform将aerial images全部转为ground images。然后,本论文使用vgg16作为backbone提取feature maps,这里不像以前的方法把图像变成一个向量的representation,而是最后输出一对feature volume。这样做的目的就是为后续进行圆周卷积提取orientation做准备。

      • 第②部分就是计算这对feature volume的correlation。这里采用的计算方式就是圆周卷积。最后correlation最大的地方就是ground images的朝向。

      • 第③部分就是根据前一步得到的orientation将Aerial Features进行裁剪,然后与Ground Features进行距离计算。

    • 细节

      • 地面的摄像头是垂直于地面的,然后空域的摄像头是平行于地面

      • 因为是水平方向旋转的,那么就要确保CNN 将变换图像的最左侧和最右侧视为水平并列

      • 用VGG16作为底层框架,主要用前十层

      • 因为极坐标转化是水平方向的转化,那么就会带来垂直方向的volume失真,所以修改了后面三层的参数,降低了特征图的高度,保留了宽度

        • 对垂直方向的失真更加宽容
      • 降低乐feature channel number 到16

      • Dynamic Similarity Matching

        • 拥有了朝向,就可以比较特征

        • 但是,朝向并不是永远可以得到,并且朝向的错误会提升定位的困难程度,尤其是视域是有限的时候,

        • 人类在地图上给自己定位的时候,是通过自己已经看到的东西定位的

        • 通过azimuth angle axis方位角来计算,简单来说就是用inner product

          • 得分最大的那个位置,就是这个地面图片和空域图片的相对角度
        • 当地面的图片是一个全景图的时候,不论朝向知不知道,相似度结果就是L2Distance 2(1-max([Fa*Fg](i))

        • 如果有多个相同的最高分,那么随机选择一个,因为这说明,这个空域的图像有不可避免的对称性

    • 表现

      • 提升相当显著

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-09-15 02:00:48  更:2022-09-15 02:01:59 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/28 18:23:46-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计