IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【图像压缩】棋盘格上下文模型 -> 正文阅读

[人工智能]【图像压缩】棋盘格上下文模型

博主的复现代码:Github链接

论文链接:arxiv PDF

标题:Checkerboard Context Model for Efficient Learned Image Compression (CVPR 2021)

作者:Dailan He(商汤)

论文简介

在之前的端到端图像压缩框架中,为了达到SOTA的性能,都使用了mbt2018中的Joint Autogressive的上下文自回归模型。然而,该上下文模型的编解码需要串行实现,使得计算效率显著降低。本文提出的棋盘格上下文模型,有效克服了这个缺点,在几乎不损失编码性能的前提下,将编解码速度提升了四十倍。

文章首先设计了一个random mask实验,分析了不同位置的空间上下文对码率节省的情况,发现在待编码上下左右位置的空间相关性最大。

随后,提出了一种棋盘格上下文模型,将待编码的潜在表示y,按棋盘格的方式划分为anchor和non-anchor。anchor仅仅使用Hyper Prior的先验信息进行编解码;而non-anchor不仅可以使用Hyper Prior信息,而且可以将已解码的anchor作为上下文先验信息进行编码。

?该上下文模型,只需要一次编码、两次解码,极大提高了计算并行度,并且得到了不错的性能。

论文复现

博主复现了文中的“mbt2018 + checkerboard”模型,该模型仅仅改变了上下文模型,将串行上下文替换为棋盘格上下文。总体流程图如下,其中蓝色是编码过程,红色是解码过程,黄色是编解码共用的过程。

?在编码时,论文只需要一次编码。而使用Compress AI复现时,y_anchor的量化必须先减去均值,而均值的获得必须通过gep网络,因此在复现时需要增加这样一个步骤。

而解码时,可以按照文章中的两步解码来完成。

关于anchor和non_anchor的复用与解复用,可以参考文章在Supplementary Material中的描述,使用切片、转置等来实现。博主参考了Space2Depth的实现方式。

至于论文复现的其他细节,可以参考博主的github链接:https://github.com/leelitian/Checkerboard-Context-Model-Pytorch

如果文章对你有帮助,记得点个赞噢~?

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-03-15 22:31:54  更:2022-03-15 22:34:30 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/9 15:54:11-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码