IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 【模型量化】HAQ:强化学习让模型压缩90%而精度几乎不受影响 -> 正文阅读

[人工智能]【模型量化】HAQ:强化学习让模型压缩90%而精度几乎不受影响

HAQ-for-Mobilenetv3-Quantization

代码地址:

https://github.com/Sharpiless/HAQ-for-Mobilenetv3-Quantization

论文地址:

https://arxiv.org/abs/1811.08886?

算法简介:

HAQ(Hardware-Aware Automated Quantization with Mixed Precision)是一个自动化的混合精度量化框架,使用强化学习让每一层都学习到了适合该层的量化位宽。
在这里插入图片描述
不同的网络层有不同的冗余性,因此对于精度的要求也不同,当前已经有许多的芯片开始支持混合精度。通常来说,浅层特征提取需要更高的精度,卷积层比全连接层需要更高的精度。如果手动的去搜索每一层的位宽肯定是不现实的,因此需要采用自动搜索策略。

另一方面,一般大家使用FLOPS,模型大小等指标来评估模型压缩的好坏,然后不同的平台表现出来的差异可能很大,因此HAQ使用了新的指标,即芯片的延迟和功耗。

搜索的学习过程是代理Agent接收到层配置和统计信息作为观察,然后输出动作行为即权值和激活的位宽。其中一些概念如下:

  1. 观测值-状态空间,一个10维变量,如下:在这里插入图片描述
  2. 动作空间,使用了连续函数来决定位宽,离散的位宽如下:在这里插入图片描述
  3. 反馈,利用硬件加速器来获取延迟和能量作为反馈信号,以指导Agent满足资源约束
  4. 量化,直接使用线性量化方法,其中s是缩放因子,clamp是截断函数:在这里插入图片描述
  5. c的选择是计算原始分布和量化后分布的KL散度,这也是很多框架中的做法:在这里插入图片描述
  6. 奖励函数,在所有层被量化过后,再进行1个epoch的微调,并将重训练后的验证精度作为奖励信号:在这里插入图片描述
  7. 智能体,使用了深度确定性策略梯度(DDPG)方法:在这里插入图片描述
  8. 训练策略:在这里插入图片描述

数据集:

数据及使用DTD数据集,下载后运行:

python  lib/utils/make_data.py

预处理数据及路径

预训练模型:

bash run_pretrained.sh

聚类搜索:

bash run_kmeans_quantize_search.sh.sh

搜索完后将搜索到的结果添加到finetune.py中

开始量化:

bash run/run_kmeans_quantize_finetune.sh

实验结果:

(还没跑完,下面是官方结果)

Modelspreserve ratioTop1 Acc (%)Top5 Acc (%)
resnet50 (original)1.076.1592.87
resnet50 (10x compress)0.175.4892.42
Modelspreserve ratioTop1 Acc (%)Top5 Acc (%)
mobilenetv2 (original)1.072.0590.49
mobilenetv2 (0.6x latency)0.671.2390.00

关注我的公众号:

感兴趣的同学关注我的公众号——可达鸭的深度学习教程:

在这里插入图片描述

联系作者:

B站:https://space.bilibili.com/470550823

CSDN:https://blog.csdn.net/weixin_44936889

AI Studio:https://aistudio.baidu.com/aistudio/personalcenter/thirdview/67156

Github:https://github.com/Sharpiless

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-07-11 16:38:36  更:2021-07-11 16:41:17 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/17 21:53:46-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码