IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> C++知识库 -> NEON汇编比纯C代码快17倍 -> 正文阅读

[C++知识库]NEON汇编比纯C代码快17倍

最近在准备第三季的内容时候看了一下NEON汇编指令,挺有意思。我写了个小程序来试试NEON汇编指令究竟能有多少快。有的小伙伴可能不知道啥鸟是NEON。其实NEON就是ARM公司给自家的SIMD指令取了一个好听的花名。

SIMD指的是单指令多数据流,它对多个数据元素同时执行相同的操作。这些数据元素被打包成一个更大的寄存器中的独立通道(Lanes)。例如,ADD指令将32位数据元素加在一起。这些值被打包到两对128位寄存器(分别是V8和V9)中的单独通道中。然后将第一源寄存器中的每个通道添加到第二源寄存器中的相应通道,然后将其存储在目标寄存器(V10)中的同一通道中。

? ? ?ADD V0.4S, V1.4S, V2.4S

ADD指令会并行做4个加法运算,它们分别位于处理器内部的4个计算通道并且是相互独立的,任何一个通道发生了溢出或者进位都不会影响其他通道。

? ? ?V0.4S[0] = V1.4S[0]+ V2.4S[0]

? ? ?V0.4S[1] = V1.4S[1]+ V2.4S[1]

? ? ?V0.4S[2] = V1.4S[2]+ V2.4S[2]

? ? ?V0.4S[3] = V1.4S[3]+ V2.4S[3]

? ? ? ? ? ? ? ? ? ? ? ? ? ?

SIMD非常适合图像处理场景。图像的数据常用的数据类型是RGB565,RGBA8888, YUV422等格式,这些格式的数据特点是一个像素点的一个分量(A、R、G以及B分量)使用8位数据表示。如果使用传统的处理器做计算,虽然处理器的寄存器是32位或是64位的,处理这些数据确只能使用寄存器的低8位,有点浪费浪费。如果把64位寄存器拆成8个8位数据通道就能同时完成8个操作,计算效率提升了8倍。

背景

RGB24图像格式是一个像素用24个位(3个字节)表示R(红)、G(绿), B(蓝)三种颜色。它们在内存中的存储格式是R0、G0、B0、R1、G1、B1,以此类推。而BGR24图像格式与RGB24有一点不一样,它在内存的存储格式是B0、G0、R0、B1、G1、R1,依次类推。? ? ? ? ? ? ? ? ? ? ? ?

下面用C语言来实现RGB24转BGR24。

后面我分别使用手工编写NEON汇编以及使用NEON内建函数的方式来改写这个段C语言代码,然后在树莓派4b上跑了一下:分别使用这三种方式来转换10张4K大小的图像数据。

惊呆

不跑不知道,一炮吓一跳!使用NEON指令优化的纯汇编代码比纯C语言要快17倍以上,比使用NEON内建函数要快4倍以上。

我将在第三季视频课程里和大家详细聊一聊NEON指令,有趣!第三季视频课程:ARM64体系结构与编程,等你哟!

  C++知识库 最新文章
【C++】友元、嵌套类、异常、RTTI、类型转换
通讯录的思路与实现(C语言)
C++PrimerPlus 第七章 函数-C++的编程模块(
Problem C: 算法9-9~9-12:平衡二叉树的基本
MSVC C++ UTF-8编程
C++进阶 多态原理
简单string类c++实现
我的年度总结
【C语言】以深厚地基筑伟岸高楼-基础篇(六
c语言常见错误合集
上一篇文章      下一篇文章      查看所有文章
加:2022-03-10 22:13:22  更:2022-03-10 22:13:52 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 5:37:47-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码