IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 嵌入式 -> ARM NEON - RGB转灰度的实现 (DSP Factory学习总结) -> 正文阅读

[嵌入式]ARM NEON - RGB转灰度的实现 (DSP Factory学习总结)

DSP Factory是B站up主的一个开源工程,不是我,我只是从这个工程中学到了NEON的知识,这里做一下总结。对我有用的地方有2个,一个是memcpy,另一个是RGB转Gray的NEON实现。

配套有2个视频,第一个14分钟讲了数据格式和介DSP Factory工程本身。

https://www.bilibili.com/video/BV1dq4y157NA

第二个45分钟的视频讲解了DSP Factory里面函数的使用方法。

https://www.bilibili.com/video/BV1V64y1X7Eo

这里给出了DSP Factory的地址,翻墙可以获取

dsp_factory: https://github.com/leonard73/dsp_factory

我这里将里面的重点列一下。

所谓的D register,也就是double精度的register,使用64bit,同样的,Q的意思是quadruple,4倍精度,占用128bit。
在这里插入图片描述
在这里插入图片描述
这些数据结构,可以将我们平时使用的标数据转为向量数据。如右图,如果512个uint16的数组,如果每次处理16bit,需要处理512次;而将64bit做为一个向量来处理,只需处理128次。

但是使用NEON是有限制的:NEON对内存的对齐是强制依赖的。因为使用的是D或者Q register,必须填充完毕,这样才能发挥SIMD的优势。
在这里插入图片描述
在这里插入图片描述
下面是RGB888单独提出各通道数据的实现
在这里插入图片描述
下面是RGB转灰度的公式
在这里插入图片描述
普通的实现和NEON的实现,可以在DSP Factory的NeonRgb2Gray.c 里面查看到
在这里插入图片描述

void do_RGB2GRAY_I16_Neon(unsigned char *src, unsigned char * dst, unsigned int width, unsigned int height)

void do_RGB2GRAY_I16(unsigned char *src, unsigned char * dst, unsigned int width, unsigned int height)

可以将这2个函数对比着看,收获会更大。

有用的tips:

1.ARMv8之后的架构才支持NEON

2.在编译选项启用 NEON 的配置是 -mfpu=neon

3.NEON是强制对齐的

4.数组能否被64或者128bit对齐,是能否使用NEON API的关键

5.未加速和使用NEON的函数,需要测试才能够确定是否达到预期

备注:

《NEON Programmer’s Guide》

ARM 官方指令查询

gcc 在线API 查询

  嵌入式 最新文章
基于高精度单片机开发红外测温仪方案
89C51单片机与DAC0832
基于51单片机宠物自动投料喂食器控制系统仿
《痞子衡嵌入式半月刊》 第 68 期
多思计组实验实验七 简单模型机实验
CSC7720
启明智显分享| ESP32学习笔记参考--PWM(脉冲
STM32初探
STM32 总结
【STM32】CubeMX例程四---定时器中断(附工
上一篇文章      下一篇文章      查看所有文章
加:2021-09-01 12:05:12  更:2021-09-01 12:07:19 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 0:53:00-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码