| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> Paper Reading||Distance-aware Quantization -> 正文阅读 |
|
[人工智能]Paper Reading||Distance-aware Quantization |
论文(ICCV 2021):https://arxiv.org/abs/2108.06983 DAQ 概要1 Motivation
? 对于 Motivation 2 ,作者认为,软量化器是有效的,但其仅在训练阶段使用,而推理阶段使用的还是硬量化器。那么如果直接从软量化器转化成硬量化器,就会导致待量化的数据映射得比较“剧烈”,跳变还是比较僵硬,即所谓的 Quantizer Gap 问题。 2 Method2.1 Overview? 设全精度输入为 x ^ \hat{x} x^ (可以代表 Weight w ^ \hat{w} w^ 或 Activation a ^ \hat{a} a^ ),经过 b b b-bit 量化器 Q Q Q 会得到量化后的值 Q ( x ^ ) ∈ { 0 , 1 , . . . , 2 b ? 1 } Q(\hat{x})\in \{0, 1, ..., 2^b-1 \} Q(x^)∈{0,1,...,2b?1} 。整个流程如 Fig 2 所示。 ? 在此之前,先要对 x ^ \hat{x} x^ 进行 Clip 和 Normalize,将数据分布范围限制到量化区间内,如下公式所示:
2.2 DASR? 四舍五入操作即将一个全精度的输入仿射到最邻近的量化值。这个过程可以看成两步:第一步,计算全精度值与量化值的距离。第二步,根据
a
r
g
m
i
n
argmin
argmin 操作将全精度值映射成最短距离的那个量化值,但整个过程不可导。如 Fig 1 所示。 ? 针对这个问题,作者提出 DASR,用可微的赋值算子来近似离散四舍五入函数。与两布操作类似,DASR 经过公式 (1) 得到 x x x ,然后根据有限个的量化值 q ∈ q , ? q = { 0 , ? 1 , ? . . . , ? 2 b ? 1 } q \in \bm{q},~\bm{q}=\{0,~1,~...,~2^b-1\} q∈q,?q={0,?1,?...,?2b?1} 来计算 Distance Scores。接着在利用 s o f t ? a r g m a x soft~argmax soft?argmax 函数,将 x x x 分配成与量化值非常接近的一个浮点值。具体描述如下:
2.3 Temperature? Temperature 参数 β \beta β 可以调节距离置信度函数 m x m_x mx? 的形状分布,即也影响了 Soft Assignment ? \phi ? 。但是固定的 β \beta β 是有缺点的:
? 综上,Temperature 参数 β \beta β 需要进一步地设计:
3 Experiment
? Table 2 、Table 3、Table 4 为 ImageNet上的比较。Table 5 为 CIFAR10 上的比较。
4 Appendix4.1 Derivation of Eq. (9)? 作者给出了
?
\phi
? 公式最终详细的推导过程:
4.2 Overall Process of DAQ4.3 Design of DAQ? 关于距离得分函数和采样核函数,作者也尝试过其他的公式,但是效果都不如原文里的好,故最后选择原文的方法。 4.4 Experiments on the SR Task? 作者还在超分辨率任务上做了实验,具体在这里就不展示了。感兴趣的旁友可以翻翻原文。 个人思考
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 22:51:37- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |