[人工智能] 基于NeRF的三维内容生成

IT数码购物网址头条软件日历阅读图书馆

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

图片批量下载器
↓批量下载图片,美女图库↓

图片自动播放器
↓图片自动播放器↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 基于NeRF的三维内容生成 -> 正文阅读

[人工智能]基于NeRF的三维内容生成

来源：深蓝学院《基于NeRF的三维内容生成》张凯
在这里插入图片描述
请添加图片描述

三维内容

请添加图片描述

从图片中生成三维内容【人工耗费时间、精力】 => 通过计算机辅助手段来自动生成

图片：非常容易获得 => 反渲染生成三维内容

计算机图形学：如何去生成高质量的渲染图像
计算机视觉：给定图片 => 反渲染生成计算机图形学中所需要的三维内容【可以改变光照，插入物体等等】

反渲染的三个要素

请添加图片描述

1.形状表征

请添加图片描述

Triangle Mesh、Point Cloud、Occupancy field、Signed distance filed
不同形状表征可能会决定解决问题的难度【不同的优化方法】

2.外观

左边将材料和光照分开表征【理想情况，可以换光照，编辑材质，但非常难解（涉及到图形学中的渲染过程）】，右边将材料和光照打包到一起【无法很好编辑，把物体放到新的环境里观察它的外观，】

在这里插入图片描述

反渲染相对于三维重建，关键的是differentiable，2D->3D->2D
三维重建是反渲染的一个特例，三维重建原本不focus渲染质量。

3.渲染过程【优化】

在这里插入图片描述
Ray tracing rendering: 追踪光线的传播过程，对图像中穿过每一个pixel的光线方向颜色分布进行加权求和的过程=>得到像素的颜色

NeRF

在这里插入图片描述
右图：深度图质量非常高

在这里插入图片描述

Soft Shape: 像雾一样，在空间中每一部分都出现一点，不像固体物体一样只占空间的一小部分。

成功因素：
1.形状表征【软形状表征（雾状）】
2.外观【材料和光照】
3.渲染过程【函数都是可微的】
在这里插入图片描述

右边的几何细节可能不够好【NeRF缺点】

之前用神经网络的工作不够好 =>选择了硬表征方式（eg. Triangle Mesh）

选择软形状成功的原因：
在这里插入图片描述
缺点：光线上每一个点都predict颜色=>Expensive

在这里插入图片描述
=》证明软形状的有效性，没有神经网络仍然可以实现比较好的渲染
没有神经网络（evaluation很慢），对于每个像素的光线都要去querry

初期引入神经网络来进行场景表示：在这里插入图片描述
另一个问题：神经网络有special bias，倾向于拟合smooth shape=> 引入了一种map $Y$

在这里插入图片描述

五种场景：

在这里插入图片描述

360 没有背景，只有前景
只在很小范围内移动相机
全景拍摄模式
在房间里拿着手机随便拍【相机分布更加不规则】
360in和outforward的场景，既想重建前景又想重建背景

在这里插入图片描述
局部or总体有一个trade off (a) 把点都选在前景上 (b) 把点分别分在前景后景中
有resolution问题

NeRF++

在这里插入图片描述

画球形式处理前景后景
在这里插入图片描述

这种wrapping的性质可以很好的解决分辨率问题：空间受到挤压
在这里插入图片描述

NeRF本身有很好的composition的性质

NeRF目前还无法在实时在线设备上运行，还无法很好地支持编辑。
在这里插入图片描述
NeRF采样频率对应pixel大小
NeRF核心假设: 物体是静态的

锯齿问题出现在降采样时，和图像采样频率有关。

奈奎斯特频率问题
在这里插入图片描述

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

上一篇文章下一篇文章查看所有文章

加:2022-07-05 23:31:36 更:2022-07-05 23:33:41

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/29 17:03:01-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码