| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 016 _SSS_ GAN Inversion for Consistent Video Interpolation and Manipulation -> 正文阅读 |
|
[人工智能]016 _SSS_ GAN Inversion for Consistent Video Interpolation and Manipulation |
016_SSS_ GAN Inversion for Consistent Video Interpolation and Manipulation本文结合了GAN Inversion和Neural ODE,在GAN的隐空间中实现Neural ODE来实现视频的插帧和编辑。 1. Introduction本文的主要贡献和创新点:
2. Method2.1 背景知识GAN InversionGAN的目的是将隐变量 z ∈ Z z \in \mathcal{Z} z∈Z 通过Generator转换为相应的图像 x ∈ X x \in \mathcal{X} x∈X. 而GAN Inversion则恰恰相反, 对于一个已经训练好的GAN的生成器 G G G, 和一张给定的图像 x x x, GAN Inversion希望找到最有可能生成图像 x x x 的隐变量 z z z. 相应的对于两张相似的图像, 通过GAN Inversion之后得到的隐变量也应该相近. Neural ODE具体的Neural ODE的笔记可以参考007_SSSSS_ Neural Ordinary Differential Equtions 简而言之, 在本文中就是把视频的每一帧图像对应的隐空间表示, 看作是常微分方程的解. 相应的给定常微分方程的初值, 就可以通过求解来得到中间的任何时间的值. 2.2 DynODE有了以上两部分的基础, 那么作者提出的DynODE的思路便一目了然. 首先, 一个视频的隐空间表示可以看做是连续的变化 z ( t ) z(t) z(t). 而对于一个视频的离散的帧, 通过GAN Inversion得到一系列的隐式表示 { z 0 , z 1 , . . . , z n } \lbrace z_0, z_1, ..., z_n \rbrace {z0?,z1?,...,zn?}, 相当于是对这个连续的变化的观测值. 那么, 为了得到这个连续的变化, 将其用常微分方程表示: 于是在训练网络的时候, 就用完整的视频的每一帧来训练. 训练好之后, 在给定初始帧的表示 z 0 z_0 z0? 的前提下, 就可以通过求解常微分方程的形式来得到任意时刻的隐式表示. 3. Experiments主要来看本文的两个应用 视频插帧和视频编辑 3.1 视频插帧给定两帧的视频插帧, 可以看作是morphing, 而一种直接的morphing方法, 就是直接对隐变量进行线性的组合. z ? = z s + α ( z t ? z s ) z^* = z_s + \alpha (z_t - z_s) z?=zs?+α(zt??zs?), 那么利用ODE的方法与这种直接线性相加的方法有什么区别呢? 作者给出的解释就是, 如图所示, 曲面表示视频的动态表示, 而线性相加的方法得到的视频帧就如同绿色的点, 并不能完全的契合视频的动态流. 而用ODE的方法就像蓝色的箭头, 可以更好的耦合视频, 而红色的点就是用ODE方法得到的视频帧. 实验的结果如图所示. 这里有一个问题: 上面作者用的Neural ODE是给定了初值, 那么在视频插帧的时候能不能保证终值, 或者如何保证终值, 这是个问题. 本文没有公开源码, 还需要再想想这个问题. 3.2 视频编辑对于视频的编辑需要结合GAN Inversion对图像编辑的方法,对于第一帧进行编辑, 然后通过解ODE来得到后续的编辑后的帧的隐变量. 传统的方法则是需要对每一帧都执行编辑的操作, 而本文的方法则只需要对第一帧进行编辑即可. 4. Limitations本文方法优点一方面是ODE带来的极低的空间复杂地, 另一方面是只需要对第一帧进行操作, 可以很大程度的降低编辑的时间消耗. |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/28 3:32:40- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |
数据统计 |