| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 网络协议 -> 【计算机网络自顶向下方法】手把手带你设计一个可靠且高效的数据传输协议 -> 正文阅读 |
|
[网络协议]【计算机网络自顶向下方法】手把手带你设计一个可靠且高效的数据传输协议 |
1. 引言稍微了解计算机网络的朋友都会知道的一点是,我们一般说 TCP/IP 协议栈中传输层的协议 TCP 是可靠的,而同样是传输层的协议,UDP 协议则是不可靠的。实际上,不仅对于传输层的部分协议,针对网络协议分层模型中的数据链路层和应用层,实际应用中也都对其中一些协议存在数据传输的可靠性要求。 由于数据传输可靠性的意义不言而喻,因此本文旨在讨论一般情况下,针对无论处于哪一层的协议,保证其实现可靠的数据传输需要哪些机制,以及这些机制是如何保证数据传输的可靠性,以此来加深读者对于 TCP 等协议是如何实现可靠数据传输这一点的理解。 为便于读者理解,下图首先给出接下来讨论所使用的框架,如图 a 所示,可靠的数据传输信道为上层的实体提供了服务的抽象,在可靠的信道内,传输的数据不会发生丢失或误码,而且所有数据在接收端被接收到的顺序和其在发送端被发送出去的顺序一致。实际上,这也是当互联网应用调用 TCP 协议发送数据时,后者向前者提供的服务模型。 上述提到的服务抽象实际上就是由可靠的数据传输协议负责实现的。事实上,要实现一个可靠的数据传输协议却并不简单,因为一个可靠的数据传输协议,其底层所依赖的传输链路可能并非是可靠的。例如:传输层协议 TCP 是一个可靠的数据传输协议,但其所赖以实现的网络层协议 IP 却并非是可靠的。 由于对于可靠的数据传输协议底层所依赖的传输链路来说,导致其不可靠本质的原因有很多;因此,接下来,本文将通过不断考虑更加复杂的情况,来尝试设计一个可靠的数据传输协议。例如:如果底层的链路或信道可能引起误码或丢包1,那么应该使用什么样的机制来解决。 上面的图 b 展示了后续即将设计的可靠数据传输所涉及的接口:
2. 设计一个可靠的数据传输协议下面,本文将人为通过对底层信道或链路进行施加约束的方式,来一步步介绍怎么样在不断变得负责的情况下实现一个可靠的数据传输协议。 2.1 rdt1.0 假定底层信道也可靠首先是最简单的情形,即假定底层信道也是可靠的。这是我们称该协议为 rdt1.0 ,下图给出了此时发送端和接收端的有限状态机,其中图 a 表示发送端的操作而图 b 表示接收端的操作。 在解释图中收发双方的状态机之前,有必要对图中的符号和文字含义解释如下:
下面是对于下图中 rdt1.0 收发双方状态机的详细解释:
在 rdt1.0 中,由于其构建在本身就是可靠的信道或链路之上,因此接收方不需要向发送方提供是否接受成功的应答。 2.2 rdt2.0 假定底层信道有误码实际上,在实际中上述假设是不可能成立的,即底层的信道总是有可能出现误码6的,因此在 rdt2.0 中来讨论如何解决这个问题,同时这里依旧假设数据包在收发双方被发送或接受的顺序是一致的。 在尝试解决上述问题之前,我们来看一个现实中的例子。假设你正在和别人打电话,而且这时候你需要将对面说的一大段内容都记录下来。在正常情况下,当你每记录一句话之后你都会和对方说“好的”,但如果你没有听清楚对方说的某一句话,此时你会跟对方说“请再重复一下”。 上面这个实际的例子其实就通过使用“肯定应答”和“否定应答”的方式来实现准确的信息交互。实际上,在计算机网络中也是同样的道理,且基于这种方式实现的可靠数据传输协议称为自动重复请求协议(ARQ: Automatic Repeat reQuest)。 由上述讨论可知,要应对可靠传输协议底层信道可能产生误码的情况,ARQ 类协议至少应该具体的机制如下:
下图是 rdt2.0 协议即采用了上述机制实现的可靠数据传输协议的收发双方有限状态机:
如上图 b 所示,接收端仅有一个状态:
上述 rdt2.0 看起来好像是一个可靠的数据传输协议,但实际上其有一个致命的缺陷,即 rdt2.0 没有考虑到 ACK 或 NAK 数据包也可能发生误码的情况。 为了解决这个问题,你的第一反应可能是给 ACK 或 NAK 数据包也加上校验和字段,然而更关键的问题不止于此,而是该协议如何能在发送方收到发生误码的 ACK 或 NAK 之后还能正确判断接收方是否准确的收到了刚刚的数据包,因此更关键的问题是发送方如何直接从产生误码的 ACK 或 NAK 得到期望的信息。 下面考虑当 ACK 或 NAK 确实发生误码时,可能采取的 3 3 3 中处理方式:
2.2.1 rdt2.1针对 ACK 和 NAK 可能发现误码这个问题,包括 TCP 在内的数据传输协议都采用了一种简单的方式来解决这个问题,即为发送方的数据包中新增一个字段,该字段填写的是发送方为数据包编号之后的数字即序列号,然后接收方只需要检查该序列号就能确定收到的数据包究竟是否为重传报文。 对于上述 rdt2.07 而言,使用 1 1 1 个比特位的序列号就能满足要求,因为这就已经能让接收方知道发送方究竟是在进行报文重传还是发送新的数据包,具体地:
需要说明的是,由于截至目前我们依然假设收发双方的信道不会产生丢包,因此 ACK 和 NAK 报文本身并不需要指定是针对哪个收到的数据包的应答反馈,即发送方天然地就知道其收到的 ACK 或 NAK (无所谓是否产生误码8)是针对其最近发出去的数据包的反馈。 上面增加了序列号的数据传输协议(以下称为 rdt2.1),相较于 rdt2.0 ,其收发双方的有限状态机都有更多的状态。原因在于,协议状态需要反映发送方当前发送的或者接收方期望接收的报文究竟序列号为 0 0 0 还是 1 1 1 。 下图分别是 rdt2.1 中发送方和接收方的有限状态机:
2.2.2 rdt2.2上述 rdt2.1 使用 NAK 来表明其收到来自发送方的数据包有误码产生,实际上,也可以不用 NAK 而是仅使用 ACK 就实现同样的效果,即当接收方收到来自发送方的数据包有误码产生时,接收方向发送方应答针对上一个正确接收的数据包的 ACK ,如果提前约定好,那么此时发送方收到针对同一个数据包的两个 ACK 时,就知道接收方并未能正确接收紧随其后的数据包。 上面给出的不使用 NAK 而仅使用 ACK 作为接收方对所有收到报文(不管产生误码与否)进行应答的协议以下称为 rdt2.2 。rdt2.1 和 rdt2.2 之间的区别主要就在于,接收方在发送 ACK 应答时需要带上对应报文的序列号,而发送方在收到 ACK 时,也需要检查其中的序列号。 下图分别是 rdt2.2 中发送方和接收方的有限状态机:
2.3 rdt3.0 假定底层信道有误码和丢包现在假定收发双方间的信道除了可能引起误码外,还可能产生丢包,实际上丢包在今天的计算机网络(包括因特网)中还是很常见的现象。信道丢包的可能又引出了对设计可靠数据传输协议的两大挑战:
实际上,rdt2.2 协议中已有的报文校验和、序列号、ACK 应答包和报文重传等机制已经可以解决上述第二个挑战了,而解决第一个挑战则需要新的协议机制。 这里,新的协议机制将会把负责探测丢包和丢包处理的任务都放到发送方来解决。 假设发送方发送了数据包之后,要么数据包本身,要么接收方针对该数据包的 ACK 应答包丢失了,此时都将导致发送方不可能收到接收方的应答。如果愿意等待足够长的时间,那么发送方是可以判断出数据包是否丢失的,但是问题是究竟多长时间算足够长? 首先,接收方的等待时间至少要大于收发双方间报文往返的时间(可能还要包括在二者中间的路由器中缓存的时间)加上接收方处理报文的时间等。实际上,在多数计算机网络中,这一所谓足够长的时间是很难精确计算的。 其次,为实现高效地数据传输,理想的情况下,丢包的问题应该尽快得到解决,否则将导致数据传输的效率急剧下降。 在实际中,发送方通过审慎地选择一个折中的时间长度,使得过了这么长时间后就判定数据包大概率已经丢失了,此时发送方将进行报文重传。 需要注意的是,如果一个数据包在传输过程中经历了特别长的时延,即使最终该数据包本身以及接收方的 ACK 应答都没有丢失,发送方也将进行报文重传,虽然这将会为收发双方的信道中引入重复的数据包,但幸运的是 rdt2.2 中的报文序列号机制已经可以处理这一情形了。 实际上,从发送者的角度可以说是“遇事不决,报文重传”了。当发送方并不知道究竟是数据包本身丢失或延时过长了,还是 ACK 应答丢失了抑或是延时过长了。在所有这些情况下,发送方的做法都一样:报文重传。 下图是 rdt3.0 中发送方的有限状态机: 由上图可知,相较于 rdt2.2 ,为了应对丢包的情况,这里引入了计时器,具体地:
为了更好地理解引入计时器机制的 rdt3.0 是如何在收发双方信道可能引起误码和丢包情况下进行可靠的数据传输,下面给出几个示例,分别表示 rdt3.0 在无丢包和有丢包的情况下是如何工作的: 截至目前,rdt3.0 已经是一个较为成形的可靠的数据传输协议了。 3. 设计一个可靠且高效的数据传输协议3.1 管道化传输上述 rdt3.0 在功能上已经基本可以实现可靠的数据传输了,但是其传输效率却差强人意,其本质原因是 rdt3.0 是一个停止-等待型协议。 为了更好的理解为什么停止-等待型协议的效率低下,可以用下面这样一个例子:假设有两台主机,分别位于黑河和腾冲(如下图所示),报文在二者之间的往返传播时延(记为RTT)大概为 30 30 30 毫秒,假设两台主机之间通过传输速率为 R R R 为 1 ?Gbps 1\text{ }\text{Gbps} 1?Gbps (即每秒传输 1 0 9 10^9 109 比特)的链路相连。 假设每个数据包大小
L
L
L 为
1000
1000
1000 字节(约
8000
8000
8000 个比特,包括报文头和数据),因此将每个数据包传入二者链路所需时间为: 通过下图 a 我们可以进一步量化停止-等待型协议效率低下的程度。如果发送方在 t = 0 t=0 t=0 的时候发送数据包,那么由上述计算:
因此,在整整
30.008
?ms
30.008\text{ }\text{ms}
30.008?ms 的时间里,发送方只有
0.008
?ms
0.008\text{ }\text{ms}
0.008?ms 的时间在发送数据。具体,可以计算发送方对信道的利用率为: 解决上述传输效率低下问题的方法其实也比较简单,如上图 b 所示,即实际可以一次性发送多个数据包然后等待接收方对这些数据包的 ACK 应答,而不是以串行的方式一次只发送一个数据包然后等到收到 ACK 应答后才发送下一个。这种解决方式就是所谓的管道化数据传输。 然而,管道化传输给可靠的数据传输又带来了新的挑战:
3.2 滑动窗口协议在滑动窗口协议(又被称为GBN协议,全称Go-Back-N)中,发送方可以一次性发送不超过某个最大值如 N N N 个数据包。下图是从发送者角度来看显示的滑动窗口协议中序列号的范围和工作原理: 其中:
由此,所有可能的报文序列号就被分成 4 4 4 个区间:
由上图可知,长度为 N N N 的区间是所有可用于已发送但未收到 ACK 应答报文的序列号,该区间可视为一个窗口,在协议进行数据包收发期间,相当于该窗口在序列号所有可能取值的区间进行滑动,因此该协议被称为滑动窗口协议,而 N N N 被称为窗口大小。 需要注意的是,在实际中,滑动窗口协议中的报文序列号并非是只增不减,由于序列号这一数据域在数据包的数据头中是固定长度的,假设该长度是 k k k 个比特,那么序列号取值区间就是 [ 0 , 2 k ? 1 ] [0,2^k-1] [0,2k?1] 。有人可能会问那如何确保数据包的数量不超过序列号的最大可能取值? 实际上,并没有必要有这样的要求,因为序列号是可以重用的,具体实现方式是对于序列号的所有数学运算都使用按 2 k 2^k 2k 取模的方式进行,这就意味着序列号区间可以视为一个环形区间,即序列号 2 k ? 1 2^k-1 2k?1 后跟着的序列号9将会是 0 0 0 。 下面是基于滑动窗口协议实现可靠数据传输所对应的发送方有限状态机: 滑动窗口协议中的发送方必须响应以下三种事件:
下面是基于滑动窗口协议实现可靠数据传输所对应的接收方有限状态机:
对于上述滑动窗口协议,有些人可能觉得接收方的处理逻辑过于简单粗暴而且有浪费资源之嫌,他们的理由是接收方在除了序列号为 n n n 的数据包被正确接收并且序列号为 n ? 1 n-1 n?1 的数据包也已经被正确接收的所有其他情况下,都会直接将数据包丢弃。 实际上,接收方这么做是有其合理性的。如上所述11,接收方必须按照数据包序列号向上一层传递数据。假设序列号截至 n ? 1 n-1 n?1 的数据包都已经被成功接收且传递至上一层,此时虽然接收方期望收到序列号为 n n n 的数据包,但是实际先到达的是序列号为 n + 1 n+1 n+1 的数据包。当然,接收方可以先将序列号为 n + 1 n+1 n+1 的数据包缓存下来,等到正确接收且向上一层传递了序列号为 n n n 数据包后,再对缓存的数据包进行处理。 然而,如果此时序列号为 n n n 的数据包发生丢包,那么根据滑动窗口协议的重传规则,序列号为 n n n 和 n + 1 n+1 n+1 的数据包都会被重传。因此,接收方可以直接丢弃先到达的序列号为 n + 1 n+1 n+1 的数据包。 上述机制的优点在于,接收方的压根不需要实现缓存数据包的机制,因为没有必要。因此,虽然发送方必须要维护其窗口的上下界以及其中 上述机制的缺点在于,如果直接丢弃序列号不是 为了更好地理解上述介绍的滑动窗口协议,下面通过一个示例来说明,示例中窗口的大小为 4 4 4 : 下面是对上图简单说明:
3.3 选择重传协议对于上述滑动窗口协议,虽然其具有提高信道利用率的功能,但是当有一个数据包的传输有问题时,可能就需要重传很多个数据包。下面即将介绍的选择重传协议就是为了缓解这样的问题。 顾名思义,选择重传协议只会重传那些在传输中发生错误的数据包(如:丢包、误码、时延过长)。这种按需重传机制需要接收方针对每个成功接收的数据包发送 ACK 进行确认,而不是采用累积确认。 在选择重传协议中,同样使用宽度为 N N N 的窗口来限制信道中已发送但发送方未收到 ACK 确认的最大数据包个数;不同的是,相较于上述滑动协议,此时在窗口中将会有部分数据包已经收到了接收方的 ACK 应答。 下图展示了选择重传协议中数据包序列号的分布特点和相关含义: 在选择重传协议中,发送方会针对任何正确接收的数据包发送 ACK 应答,不管其序列号是否紧跟上一个正确接收数据包的序列号。如果接收方收到的数据包后,发现其序列号的确不是按序递增的,那么该数据包将会先被缓存下来,然后等到所有小于该序列号的数据包都正确接收之后,会一股脑将这批数据包按序向上一层传递。 下面针对选择重传协议的收发双方所应该响应的事件和应该执行的操作进行了总结:
为了使读者更好地理解以上论述,下面通过一个案例来展示选择重传协议是如何处理丢包场景的: 4. 总结至此基本就是本文的全部内容,这篇文章通过循序渐进的方式,通过假定收发双方间的信道越来越复杂,逐步引入各种机制,最终基本实现了可靠且高效的数据传输协议,在此将本文提及的各种机制总结如下表:
|
|
网络协议 最新文章 |
使用Easyswoole 搭建简单的Websoket服务 |
常见的数据通信方式有哪些? |
Openssl 1024bit RSA算法---公私钥获取和处 |
HTTPS协议的密钥交换流程 |
《小白WEB安全入门》03. 漏洞篇 |
HttpRunner4.x 安装与使用 |
2021-07-04 |
手写RPC学习笔记 |
K8S高可用版本部署 |
mySQL计算IP地址范围 |
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/8 5:49:23- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |