IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> Python+CLIP,令人惊叹的个性艺术表达 -> 正文阅读

[人工智能]Python+CLIP,令人惊叹的个性艺术表达

介绍

文章摘自:https://ml.berkeley.edu/blog/posts/clip-art/
如果觉得文档晦涩难懂,可以看我的视频操作教程。
扫码或者B站搜索“有只小新”
在这里插入图片描述

最近几个月,人工智能生成的艺术场景出现了一些爆炸式增长。

自从 OpenAI 发布了他们的 CLIP 模型的权重和代码以来,各种黑客、艺术家、研究人员和深度学习爱好者已经想出了如何利用 CLIP 作为各种生成模型的有效“自然语言方向盘”,让艺术家能够创造只需向其中一个模型输入一些文本(标题、诗歌、歌词、单词)即可获得各种有趣的视觉艺术。

例如,输入“夜间城市景观”会产生一些城市灯光的酷炫、抽象的描绘:
在这里插入图片描述
输入“魔法童话屋”:
在这里插入图片描述

需要的条件

  • Google账户
  • 合理的上网方式
  • 一点点时间和耐心

个人作品

  • Small bridge, flowing water
    The Big Sleep:
    在这里插入图片描述

  • In me the tiger sniffs the rose
    VQ-GAN+CLIP (z+quantize)
    在这里插入图片描述

  • The vast starry sky
    The Big Sleep:
    在这里插入图片描述

  • The girl in the forest
    The Big Sleep:
    在这里插入图片描述

操作地址

The Big Sleep
Aleph2Image
Deep Daze
VQ-GAN+CLIP (codebook sampling)
VQ-GAN+CLIP (z+quantize)
VQ-GAN+CLIP (EleutherAI)

工作原理

在这里插入图片描述

2021 年 1 月 5 日,OpenAI 发布了CLIP的模型权重和代码:经过训练的模型可以确定一组字幕中的哪个字幕最适合给定图像。以这种方式从数亿张图像中学习后,CLIP 不仅非常擅长为给定图像挑选最佳标题,而且还学习了一些令人惊讶的抽象和一般视觉表示。

各种黑客、研究人员和艺术家(最著名的是Twitter 上的@advadnoun和@quasimondo)只花了一天的时间就发现,通过一个简单的技巧,CLIP 实际上可以用来指导现有的图像生成模型(如 GAN、自动编码器)或隐式神经表示(如 SIREN)以生成适合给定标题的原始图像。

几种不同的方法

The Big Sleep: Humble Beginnings

在短短几周内,就有了突破。@advadnoun发布了 The Big Sleep 的代码:一种基于 CLIP 的文本到图像技术,它使用Big GAN作为生成模型。
Big Sleep 以其独特的方式大致满足了文本到图像的承诺。它几乎可以渲染任何你可以用语言表达的东西:“日落”、“像 MC Escher 画的脸”、“当风吹来时”、“3d 中的大峡谷”。
当然,The Big Sleep 的输出可能不是每个人都喜欢的。它们奇怪而抽象,虽然它们通常是全局一致的,但有时它们没有多大意义。The Big Sleep的作品绝对有一种独特的风格,我个人觉得它在审美上是令人愉悦的。

VQ-GAN: New Generative Superpowers

2020 年 12 月 17 日,海德堡大学的研究人员(Esser 等人)在 Arxiv 上发布了他们的论文“Taming Transformers for High-Resolution Image Synthesis”。他们提出了一种称为 VQ-GAN 的新型 GAN 架构,该架构将 conv-nets 与 Transformer 相结合,以最佳方式利用 conv-nets 的局部归纳偏差和transformer 的全局注意力,形成一个特别强大的生成模型。

大约 4月初,@ advadnoun和@RiversHaveWings开始做一些结合 VQ-GAN 和 CLIP 的实验,从文本提示生成图像。在高层次上,他们使用的方法与 The Big Sleep 大致相同。主要区别实际上只是该系统使用 VQ-GAN 而不是使用 Big-GAN 作为生成模型。

参考

CLIP blog post
CLIP paper
Big-GAN paper
VQ-GAN paper
The Big Sleep blog post
DeepDream blog post
DALL-E blog post
Multimodal Neurons Distill

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-07-23 10:47:03  更:2021-07-23 10:50:13 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/17 20:41:08-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码