IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 嵌入式 -> 内存零拷贝详解 -> 正文阅读

[嵌入式]内存零拷贝详解

目录

前置知识

标准设备

?标准协议

利用中断减少CPU开销

利用DMA进行继续优化

零拷贝

零拷贝之mmap

零拷贝之sendfile


前置知识

标准设备

一个标准的硬件设备包括两部分:

  1. 面向系统其他部分展现的硬件接口(类似于软件的接口),供其他硬件或软件调用
  2. 内部结构,包括设备相关的特定实现,负责具体实现设备展示给系统的抽象接口

?标准协议

一个标准设备的接口包含三个寄存器,通过读写这些寄存器,操作系统可以控制设备的行为:

  • 一个状态(status)寄存器,可以读取并查看设备的当前状态
  • 一个命令(command)寄存器,用于通知设备执行某个具体任务
  • 一个数据(data)寄存器,将数据传给设备或从设备接收数据

操作系统与标准设备的交互:

  • 第1步,操作系统通过反复读取状态寄存器,等待设备进入可以接收命令的就绪状态。我们称之为轮询(polling)设备(基本上,就是问它正在做什么)。
  • 第2步,操作系统下发数据到数据寄存器。例如,你可以想象如果这是一个磁盘,需要多次写入操作,将一个磁盘块(比如4KB)传递给设备。如果主CPU参与数据移动(就像这个示例协议一样),我们就称之为编程的I/O(programmedI/O,PIO)。
  • 第3步,操作系统将命令写入命令寄存器;这样设备就知道数据已经准备好了,它应该开始执行命令。最后一步,操作系统再次通过不断轮询设备,等待并判断设备是否执行完成命令(有可能得到一个指示成功或失败的错误码)。

缺点:轮询过程比较低效,等待设备就绪和等待设备执行完成命令浪费大量CPU时间

利用中断减少CPU开销

概念:有了中断后,CPU 不再需要不断轮询设备,而是向设备发出一个请求,然后就可以让对应进程睡眠,切换执行其他任务。当设备完成了自身操作,会抛出一个硬件中断,CPU进而跳转执行操作系统的中断处理程序,并且唤醒等待I/O的进程继续执行。

例如,在没有中断操作的时候,进程1在CPU上运行,然后发出一个读取数据的IO请求给磁盘设备,然后操作系统进行自旋轮询设备(图中的P),设备完成请求之后,请求返回,进程1继续执行

?在有了中断以后,操作系统不需要轮询等待设备准备完成,可以去执行其他进程2,设备准备好之后发出中断,操作系统继续执行线程1

?中断工作流程图

IO过程简述:

  1. 用户进程调用 read 方法,向cpu发出 I/O 请求
  2. cpu向磁盘发起IO请求给磁盘控制器,之后立马返回。返回之后cpu可以切换到其它进程执行其他任务
  3. 磁盘控制器收到指令后,于是就开始进行磁盘IO,磁盘IO完成后会把数据放入到磁盘控制器的内部缓冲区中,然后产生一个中断
  4. CPU 收到中断信号后,停下手头的工作,接着把磁盘控制器的缓冲区的数据读进内核的页缓存【这个过程是可以用DMA进行优化的】。
  5. 接着将数据从内核页缓存拷贝到用户进程空间【这个过程想要优化,只能用到我们上面说的异步IO】
  6. 最后read()调用返回。

利用DMA进行继续优化

上述采用中断的方式依旧可优化的地方,比如

进程1在运行过程中需要向磁盘写一些数据,所以它开始进行IO操作将数据从内存写入磁盘设备(图中的C),拷贝结束之后,磁盘采用中断方式开始执行IO?

也就是说在从内存拷贝到磁盘或者从磁盘拷贝到内存这个过程是可以使用DMA(Direct Memory Access)进行优化的

DMA工作方式

为了能够将数据传送给设备,操作系统会通过编程告诉DMA引擎数据在内存的位置,要拷贝的大小以及要拷贝到哪个设备。在此之后,操作系统就可以处理其他请求了。当DMA的任务完成后,DMA控制器会抛出一个中断来告诉操作系统自己已经完成数据传输。

采用DMA优化后的工作流程图

?

过程:

  1. 用户进程调用 read 方法,向cpu发出 I/O 请求
  2. cpu将IO请求交给DMA控制器,之后自己立马返回去执行其他进程的任务
  3. DMA向磁盘发起IO请求
  4. 磁盘控制器收到指令后,于是就开始进行磁盘IO,磁盘IO完成后会把数据放入到磁盘控制器的内部缓冲区中,然后产生一个中断
  5. DMA收到中断后,把磁盘控制器的缓冲区的数据读进内核的页缓存,接着抛出一个中断
  6. 操作系统收到中断后,调度cpu回来执行之前的进程:将数据从内核页缓存拷贝到用户进程空间【这一步还是只能用异步IO来优化】
  7. 最后read()调用返回。

前置知识讲完了,下面进入正题

零拷贝

场景:将磁盘上的文件读取出来,然后通过网络协议发送给客户端

?

发生了4次拷贝

  • 第一次拷贝,把磁盘上的数据拷贝到操作系统内核的缓冲区里,这个拷贝是通过 DMA 的。
  • 第二次拷贝,把内核缓冲区的数据拷贝到用户的缓冲区里,于是应用程序就可以使用这部分数据了,这个拷贝是由 CPU 完成的。
  • 第三次拷贝,把刚才拷贝到用户的缓冲区里的数据,再拷贝到内核的 socket 的缓冲区里,这个过程依然由 CPU 完成的。
  • 第四次拷贝,把内核的 socket 缓冲区里的数据,拷贝到协议栈里,这个过程又是由 DMA 完成的。

优化方式

零拷贝之mmap

read()?系统调用的过程中会把内核缓冲区的数据拷贝到用户的缓冲区里,为了减少这一步开销,我们可以用?mmap()?替换?read()?系统调用函数。mmap()?系统调用函数会直接把内核缓冲区里的数据映射到用户空间,这样,操作系统内核与用户空间共享缓冲区,就不需要再进行任何的数据拷贝操作?。

现在就只有三次数据拷贝了

零拷贝之sendfile

Linux2.1?版本提供了?sendFile?函数,其基本原理如下:数据根本不经过用户态,直接从内核缓冲区进入到?SocketBuffer?

现在就只有两次上下文切换了。?

  嵌入式 最新文章
基于高精度单片机开发红外测温仪方案
89C51单片机与DAC0832
基于51单片机宠物自动投料喂食器控制系统仿
《痞子衡嵌入式半月刊》 第 68 期
多思计组实验实验七 简单模型机实验
CSC7720
启明智显分享| ESP32学习笔记参考--PWM(脉冲
STM32初探
STM32 总结
【STM32】CubeMX例程四---定时器中断(附工
上一篇文章      下一篇文章      查看所有文章
加:2021-11-26 09:00:42  更:2021-11-26 09:01:28 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/8 5:17:26-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码