IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 嵌入式 -> ARM最新架构为memcpy/memset底层的实现提供新的指令 -> 正文阅读

[嵌入式]ARM最新架构为memcpy/memset底层的实现提供新的指令

CPY CPYM CPYP CPYE SET SETP SETM SETE,memcpy,memset

思考
1、memcpy/memset的底层是如何实现的?一个一个字节的操作吗? 可不可以四个四个字节操作呢?
2、若干年后再来回答问题1,是不是有新的方法了呢?

在大多数的[操作]系统中,memcpy()、memset()等函数的实现,其实都一个字节一个字节的处理。翻译成汇编后无非就算循环执行ldrstr指令

memcpy的底层实现:

_PTR
_DEFUN(memcpy, (dst0, src0, len0), _PTR dst0 _AND _CONST _PTR src0 _AND
	 size_t len0)
{
#if defined(PREFER_SIZE_OVER_SPEED) || defined(__OPTIMIZE_SIZE__)
	char *dst = (char *)dst0;
	char *src = (char *)src0;

	_PTR save = dst0;

	while (len0--)
		*dst++ = *src++;

	return save;
}

memset的底层实现:

(optee_os/lib/libutils/isoc/newlib/memset.c)

_PTR _DEFUN(memset, (m, c, n), _PTR m _AND int c _AND size_t n)
{
 	char *s = (char *)m;
 
 #if !defined(PREFER_SIZE_OVER_SPEED) && !defined(__OPTIMIZE_SIZE__)
......
  #endif /* not PREFER_SIZE_OVER_SPEED */
  
  	while (n--)
  		*s++ = (char)c;
  
  	return m;
 }

翻译成汇编后:


000000000e1469b8 <memset>:
memset():
/home/test/workspace/code/optee/optee_os/lib/libutils/isoc/newlib/memset.c:125
 e1469b8:       d2800003        mov     x3, #0x0                        // #0
 e1469bc:       eb03005f        cmp     x2, x3
 e1469c0:       54000041        b.ne    e1469c8 <memset+0x10>  // b.any
/home/test/workspace/code/optee/optee_os/lib/libutils/isoc/newlib/memset.c:129
 e1469c4:       d65f03c0        ret
/home/test/workspace/code/optee/optee_os/lib/libutils/isoc/newlib/memset.c:126
 e1469c8:       38236801        strb    w1, [x0, x3]
 e1469cc:       91000463        add     x3, x3, #0x1
 e1469d0:       17fffffb        b       e1469bc <memset+0x4>


这些函数在一般的软件中会经常使用,所以它们的性能尤其重要。
在ARM最新的架构中(armv9)提出了优化这些性能的方式(FEAT_MOPS),即:增加了一些指令来做这件事
在这里插入图片描述
在这里插入图片描述

  嵌入式 最新文章
基于高精度单片机开发红外测温仪方案
89C51单片机与DAC0832
基于51单片机宠物自动投料喂食器控制系统仿
《痞子衡嵌入式半月刊》 第 68 期
多思计组实验实验七 简单模型机实验
CSC7720
启明智显分享| ESP32学习笔记参考--PWM(脉冲
STM32初探
STM32 总结
【STM32】CubeMX例程四---定时器中断(附工
上一篇文章      下一篇文章      查看所有文章
加:2021-09-14 13:30:52  更:2021-09-14 13:33:19 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 2:37:57-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码