前言
本文的主要内容是计算机网络中传输层的一些基础知识,包括传输层概述、UDP 和 TCP 的一些特点,重点理解 TCP 的特点和报文段格式、连接管理、可靠传输、流量控制以及拥塞控制。
一、传输层概述
1、传输层简介
传输层是主机才有的层次。传输层介于网络层和应用层之间,它既可以使用下层(网络层)提供的服务,也要为上层(应用层)提供通信服务。 传输层的功能有: ①传输层提供进程和进程之间的逻辑通信。网络层提供的是主机之间的逻辑通信。 ②复用和分用。复用和分用类似于一个家庭的信箱,家庭的每个成员可以给信箱投信(复用),也可以从信箱收到自己的来信(分用)。 ③传输层对收到的报文进行差错检测。 ④传输层有两种协议,即 TCP 和 UDP。
2、TCP 和 UDP
面向连接的传输控制协议(TCP)在传送数据之前必须建立连接,数据传送结束后要释放连接,它不提供广播或多播服务。由于 TCP 要提供可靠的面向连接的传输服务,因此不可避免增加了许多开销,比如确认、流量控制、计时器及连接管理等。TCP 的特点是可靠、面向连接、时延大且适用于大文件。 无连接的用户数据报协议(UDP)在传送数据之前不需要建立连接,收到 UDP 报文后也不需要给出任何确认。UDP 的特点是不可靠、无连接、时延小且适用于小文件。
3、端口号
复用:应用层所有的应用进程都可以通过传输层再传输到网络层。 分用:传输层从网络层收到数据后交付指明的应用进程。 端口是传输层的服务访问点(SAP,Service Access Point),标识主机中的应用进程。这里的端口不是看得见摸得着的端口,它们也称为逻辑端口或者软件端口。 端口号只有本地意义,因此,因特网中不同计算机的相同端口是没有联系的。端口号的长度为16bit,总共可以表示 65536 个不同的端口号。 端口号分为服务端使用的端口号和客户端使用的端口号。 服务端使用的端口号又分为熟知端口号和登记端口号。 熟知端口号是给 TCP/IP 中最重要的一些应用程序,所有用户都知道。熟知端口号的范围是 0~1023,一些主要的熟知端口号如下图所示。 登记端口号是给没有熟知端口号的应用程序使用的。登记端口号的范围是 1024~49151。 客户端使用的端口号是仅在客户进程运行时才动态选择的,其端口号为 49152~65535。 套接字 Socket =(主机 IP 地址,端口号) 在网络中采用发送方和接收方的套接字组合来识别端点,套接字唯一标识了网络中的一个主机和它上面的一个进程(根据 IP 地址可以找到主机,根据端口号可以找到具体进程)。
二、UDP
1、UDP 主要特点
UDP 只在IP数据报服务之上增加了很少功能,即复用分用和差错检测功能。 UDP 的主要特点: ①UDP 是无连接的,这样可以减少开销和发送数据之前的时延。 ②UDP 使用最大努力交付,但不保证可靠交付。 ③UDP 是面向报文的,适合一次性传输少量数据的网络应用。 应用层给 UDP 多长的报文,UDP 就照样发送,即一次发一个完整的报文,如下图所示。 ④UDP 无拥塞控制,适合很多实时应用。 ⑤UDP 首部开销小,只有 8 字节,TCP占 20 字节。
2、UDP 首部格式
UDP 首部格式如下图所示。 UDP 首部共占8B,源端口号、目的端口号、UDP 长度和 UDP 检验和各占2B。 源端口号是可有可无的,如果希望收到对方的回复,就需要填上,否则可全置0。目的端口号是必须要有的,它指明了发给主机的具体进程。UDP 长度是 UDP 用户数据报的整个长度。UDP 检验和用来检测整个 UDP 数据报是否有错,错就丢弃。 分用时,如果找不到对应的目的端口号,就丢弃报文,并给发送方发送 ICMP“端口不可达”差错报告。
3、UDP 校验
伪首部的构成如下图所示。 伪首部只有在计算检验和时才出现,不向下传送也不向上递交。 17表示的是封装 UDP 报文的 IP 数据报首部协议字段是17。 UDP 长度是由 UDP 首部8B加上数据部分长度(不包括伪首部)构成的。 UDP 的校验过程可结合下图。 发送端步骤:①填上伪首部;②全0填充检验和字段;③全0填充数据部分(UDP数据报要看成许多4B的字串接起来,如果不够就用0来补齐);④伪首部+首部+数据部分采用二进制反码求和;⑤把和求反码填入检验和字段;⑥去掉伪首部,发送。 接收端步骤:①填上伪首部;②伪首部+首部+数据部分采用二进制反码求和;③结果全为1则无差错,否则丢弃数据报或交给应用层并附上出差错的警告。 伪首部+首部+数据部分采用二进制反码求和这一步中,发送端的检验和字段是全0,但是接收端的检验和字段是发送端最终求得的结果。
三、TCP
1、TCP 特点和报文段格式
TCP 的特点: ①TCP是面向连接的传输层协议。 ②每一条TCP连接只能有两个端点,每一条TCP连接只能是点对点的。 ③TCP提供可靠交付的服务,无差错、不丢失、不重复、按序到达。 ④TCP提供全双工通信。因此会有发送缓存和接收缓存,其中发送缓存中是准备发送的数据和已发送但尚未收到确认的数据;接收缓存中是按序到达但尚未被接受应用程序读取的数据和不按序到达的数据。 ⑤TCP面向字节流。TCP把应用程序交下来的数据看成仅仅是一连串的无结构的字节流,这里的流指的是流入到进程或从进程流出的字节序列。 TCP 报文段首部格式: TCP 报文段首部格式如下图所示。 结合上图分析各字段如下: 序号:占32位,在一个TCP连接中传送的字节流中的每一个字节都按顺序编号,本字段表示本报文段所发送数据的第一个字节的序号。序号也就是一串数据中第一个字节的序号。 确认号:占32位,期望收到对方下一个报文段的第一个数据字节的序号。若确认号为N,则证明到序号N-1为止的所有数据都已正确收到。 数据偏移:也称首部长度,占4位,它是TCP报文段的数据起始处到TCP报文段的起始处的距离,以4B位单位,即1个数值是4B。 紧急位URG:当URG=1时,标明此报文段中有紧急数据,是高优先级的数据,应尽快传送,不用在缓存里排队,配合紧急指针字段使用。 确认位ACK:ACK=1时确认号有效,在连接建立后所有传送的报文段都必须把ACK置为1。 推送位PSH:PSH=1时,接收方尽快交付接收应用进程,不再等到缓存填满再向上交付。 复位RST:RST=1时,表明TCP连接中出现严重差错,必须释放连接,然后再重新建立传输链接。 同步位SYN:SYN=1时,表明是一个连接请求或连接接受报文。 终止位FIN:FIN=1时,表明此报文段发送方数据已发完,要求释放连接。 窗口:指的是发送本报文段的一方的接收窗口,即现在允许对方发送的数据量。 检验和:检验首部和数据部分,检验时要加上12B的伪首部,第四个字段为6。 紧急指针:URG=1 时才有意义,指出本报文段中紧急数据的字节数。 选项:最大报文段长度MSS、窗口扩大、时间戳、选择确认等字段。 填充:在选项数据位数不够4B的整数倍时填充0补全。
2、TCP 连接管理
⑴TCP 的连接建立
TCP连接传输的三个阶段:连接建立;数据传送;连接释放。 TCP连接的建立采用客户服务器方式,主动发起连接建立的应用进程叫做客户,而被动等待连接建立的应用进程叫服务器。 假设运行在一台主机(客户)上的一个进程想与另一台主机(服务器)上的一个进程建立一条连接,客户应用进程首先通知客户TCP,它想建立一个与服务器上某个进程之间的连接,客户中的TCP会采用三次握手与服务器中的TCP建立一条TCP连接,如下图所示。 第一次握手:客户端发送连接请求报文段,无应用层数据。同步位SYN=1,序号位seq=x(x是随机的数)。 第二次握手:服务器端为该TCP连接分配缓存和变量,并向客户端返回确认报文段,允许连接,无应用层数据。同步位SYN=1,确认位ACK=1,序号位seq=y(y是随机的数),确认号ack=x+1,确认号是期待对方发送的报文段的第一个字节。 第三次握手:客户端为该TCP连接分配缓存和变量,并向服务器端返回确认的确认,可以携带数据。同步位(连接建立后置为0)SYN=0,确认位ACK=1,序号位seq=x+1,确认号ack=y+1。
⑵SYN 洪泛攻击
SYN 洪泛攻击发生在OSI第四层,这种方式利用TCP协议的特性,就是三次握手。攻击者发送TCP SYN,SYN是TCP三次握手中的第一个数据包,而当服务器返回ACK后,该攻击者就不对其进行再确认,那这个TCP连接就处于挂起状态,也就是所谓的半连接状态,服务器收不到再确认的话,还会重复发送ACK给攻击者,这样更加会浪费服务器的资源。攻击者就对服务器发送非常大量的这种TCP连接,由于每一个都没法完成三次握手,所以在服务器上,这些TCP连接会因为挂起状态而消耗CPU和内存,最后服务器可能死机,就无法为正常用户提供服务了。
⑶TCP 的连接释放
参与一条TCP连接的两个进程中的任何一个都能终止该连接,连接结束后,主机中的资源包括缓存和变量都将被释放。 TCP 的连接释放需要经历四次握手,如下图所示。 第一次握手:客户端发送连接释放报文段,停止发送数据,主动关闭TCP连接。结束位FIN=1,序号位seq=u。 第二次握手:服务器端回送一个确认报文段,客户到服务器这个方向的连接就释放了,此时为半关闭状态。ACK=1,seq=v,ack=u+1。 第三次握手:服务器端发完数据,就发出连接释放报文段,主动关闭TCP连接。FIN=1,ACK=1,seq=w,ack=u+1。 第四次握手:客户端回送一个确认报文段,再等到时间等待计时器设置的2MSL(最长报文段寿命)后,连接彻底关闭。 ACK=1,seq=u+1,ack=w+1。
3、TCP 可靠传输
网络层是提供尽最大努力交付,是不可靠传输,而传输层的 TCP 就可以实现可靠传输。 可靠指的是保证接收方进程从缓存区读出的字节流与发送方发出的字节流是完全一样的。 TCP实现可靠传输的机制有:校验;序号;确认;重传。 校验:TCP校验与UDP校验一样,都是增加伪首部进行。 序号:TCP 传输时一个字节占一个序号,序号字段指的是一个报文段第一个字节的序号。有了序号之后就可以保证数据有序的提交给应用层。 确认:TCP 发送方的缓存在发送数据之后不会立即移除发送的数据,而是在等到接收方发回来的确认信息后才进行移除,如果没有收到确认信息,就需要重传。TCP 默认使用累计确认的方式,它返回给发送方的确认信息是目前为止收到的最大序号加1(即期望的下一个序号),也就是比它小的序号数据都已经收到。 重传:TCP的发送方在规定的时间内没有收到确认就要重传已发送的报文段,也就是超时重传。TCP采用自适应算法,动态改变重传时间RTTS,也就是加权平均往返时间。 如果一直等的话就会浪费很多时间,因此引进了冗余ACK来实现快速重传。 在接收端每当比期望序号大的失序报文段到达时,就发送一个冗余ACK,指明下一个期待字节的序号。 比如发送方已发送1,2,3,4,5报文段。 接收方收到1,返回给1的确认(确认号为2的第一个字节)。 接收方收到3,仍返回给1的确认(确认号为2的第一个字节)。 接收方收到4,仍返回给1的确认(确认号为2的第一个字节)。 接收方收到5,仍返回给1的确认(确认号为2的第一个字节)。 发送方收到3个对于报文段1的冗余ACK时,就认为2报文段已经丢失,因此重传2号报文段。
4、TCP 流量控制
流量控制:动态调整发送方发送数据的速度,让接收方来得及接收。 TCP是利用滑动窗口机制实现流量控制的。在通信过程中,接收方根据自己接收缓存的大小,动态地调整发送方的发送窗口大小,即接收窗口rwnd,接收方设置确认报文段的窗口字段来将rwnd通知给发送方,发送方的发送窗口大小是接收窗口rwnd和拥塞窗口cwnd的最小值。 一个 TCP 流量控制的例子:主机A向主机B发送数据,连接建立时,主机B通知主机A接收窗口rwnd=400B,设每一个报文段是100B,报文段的序号初始值为1,主机A与主机B发送数据的流量控制过程如下图所示。 主机A收到主机B零窗口通知,此时如果主机A一直等主机B接收窗口不为0的通知到来,且主机B发送给主机A的接收窗口不为0的通知在传输时丢失,那么双方就会陷入到死锁。为了解决这个问题,TCP为每一个连接设有一个持续计时器,只要TCP连接的一方收到对方的零窗口通知,就启动持续计时器。若持续计时器设置的时间到期,就发送一个零窗口探测报文段,接收方收到探测报文段时给出现在的窗口值。若窗口仍然是0,那么发送方就重新设置持续计时器;若窗口不为0,则回传窗口值确实是丢失了,此时得到新的窗口值后就可以继续传数据了。
5、TCP 拥塞控制
拥塞控制和流量控制的区别:流量控制是点对点通信中存在的问题,拥塞控制是多对一的通信中存在的问题。 出现拥塞的条件:对资源需求的总和大于可用资源。 网络中有许多资源同时呈现供应不足,从而网络性能变坏,网络吞吐量将随输入负荷的增大而下降。 拥塞控制就是为了防止过多的数据注入到网络中。 拥塞控制的四种算法:慢开始;拥塞避免;快重传;快恢复。 一般慢开始和拥塞避免一起讨论,快重传和快恢复一起讨论。 在讨论拥塞控制前先假定:数据单方向传送,而另一个方向只传送确认;接收方总是有足够大的缓存空间,因而发送窗口大小取决于拥塞程度。因为发送窗口=Min{接收窗口rwnd,拥塞窗口cwnd}。 接收窗口和拥塞窗口的区别:接收窗口指的是接收方根据接受缓存设置的值,并告知给发送方,反映接收方容量。拥塞窗口指的是发送方根据自己估算的网络拥塞程度而设置的窗口值,反映网络当前容量。 慢开始和拥塞避免的图示如下。 一个传输轮次指的是发送了一批报文段并收到了它们的确认的时间。 一个往返时延RTT指的是开始发送一批拥塞窗口内的报文段到开始发送下一批拥塞窗口内的报文段的时间。 快重传和快恢复的图示如下。 快重传就是在收到3个重复的冗余ACK后重传数据,不用等到超时之后再进行重传操作。快恢复指的是在快重传之后将拥塞窗口调整为当前最大值的一半,然后线性增加,而不用降到1之后再指数增长,接着线性增长。
总结
以上就是计算机网络——传输层 UDP 和 TCP 的所有内容了,UDP 协议、TCP 特点和报文段格式、TCP 连接管理、TCP 可靠传输、TCP 流量控制和TCP 拥塞控制是本文中的重点知识,连接时的三次握手和断开时的四次握手应当理解并掌握。 参考视频: 传输层概述 UDP 协议 TCP 特点和报文段格式 TCP 连接管理 TCP 可靠传输 TCP 流量控制 TCP 拥塞控制
|