| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> 人工智能 -> 欢迎入坑单目深度估计 -> 正文阅读 |
|
|
[人工智能]欢迎入坑单目深度估计 |
|
目录 1.介绍深度估计深度估计目的的从一张2D图像中获取每个点距离拍摄源的位置远近(通常用颜色的深浅可视化)。
?常用的数据集 2.深度值的预处理本文以NYU为例,在我们使用PIL读取的image and depth 中,用OpenCV读取需要转化BGR to RGB,我们首先需要对它做一下标准化处理,PIL to Tensor 图像的像素值会分布在 0 - 1之间(opencv 读取的结果也需要转化为tensor? 在torchvision.transforms包里有封装好的py函数),这也是现在学习率普遍为1e-4的原因。有的文章还采用image的标准化处理,将 tensor值分布在 -1 - 1之间。
我们先用从cv2得到下面这张图像
?
3.train训练过程都大同小异, contrary between predict of model and GT , lr的更改 需要在 for 循环里更改
4. 损失函数这一部分的改变基本不大,大部分都是基于尺度不变损失进行微改的,也可以用L1,L2 hurb损失。
少数有使用 grad and normal 作为辅助损失让model 更加关注相关部分学习情况。 5.可视化很多文章都会放可视化的结果,毕竟在人的视觉感知里,带有色彩的图像远远比数据更加吸引注意力。在可视化中,需要注意的是,如果我们对图像进行了标准化处理,我们在可视化之前需要反标准化,并且乘以相应的距离(255),不然得到的结果可能有色彩的差距,毕竟 plt.show(cmp='jet')显示的只是相对差异。贴一下目前的sota BinsFormer。
6.评估准则
前三者是误差评估,Lower is better 最后一个是准确度评估 higher is better valid_mask = torch.logical_and(gt_depth > min_depth_eval, gt_depth < max_depth_eval) 比较 pred[valid_mask] 与 gt_depth[valid_mask] 避免nan值 Thresholded accuracy : thresh = torch.max((target / pred), (pred / target)) d1 = torch.sum(thresh < 1.25).float() / len(thresh) d2 = torch.sum(thresh < 1.25 ** 2).float() / len(thresh) d3 = torch.sum(thresh < 1.25 ** 3).float() / len(thresh) 误差值计算: diff = pred - target REL = torch.mean(torch.abs(diff) / target) RMSE = torch.sqrt(torch.mean(torch.pow(diff, 2))) log10 = torch.mean(torch.abs(torch.log10(pred) - torch.log10(target))) Reference 1.Revisiting Single Image Depth Estimation Toward Higher Resolution Maps 3. BinsFormer: Revisiting Adaptive Bins for MDE |
|
|
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年11日历 | -2025/11/25 3:19:41- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |