3. Wireshark 实验
本部分按照数据链路层、网络层、传输层以及应用层进行分类,共有 10 个实验。需要使用协议分析软件 Wireshark 进行,请根据简介部分自行下载安装。
准备
请自行查找或使用如下参考资料,了解 Wireshark 的基本使用:
- 选择对哪块网卡进行数据包捕获
- 开始/停止捕获
- 了解
Wireshark 主要窗口区域 - 设置数据包的过滤
- 跟踪数据流
数据链路层
实作一 熟悉 Ethernet 帧结构
使用 Wireshark 任意进行抓包,熟悉 Ethernet 帧的结构,如:目的 MAC、源 MAC、类型、字段等。
? 在cmd中进行以下操作,ping baidu.com,得到:
? 在wireshark中搜索:
? ip.addr == 220.181.38.251 and icmp
获得以上结果。
其中上面为输入框,粉色为数据列表。
上图为数据包详细数据。
上图为数据字节。
由数据包详细数据可知,
源Mac地址:f8:b4:6a:ac:c2:87
目的Mac地址:00:74:9c:9f:40:13
类型为IPV4
字段Frame number为:581
字节长度Frame Length为:74 bytes(592 bits)
问题
你会发现 Wireshark 展现给我们的帧中没有校验字段,请了解一下原因。
答:Wireshark抓包之前,在物理层网卡已经检验过,如果正确才会下一步操作,我们抓包已经校验过,所以没有。
实作二 了解子网内/外通信时的 MAC 地址
ping 你旁边的计算机(同一子网),同时用 Wireshark 抓这些包(可使用 icmp 关键字进行过滤以利于分析),记录一下发出帧的目的 MAC 地址以及返回帧的源 MAC 地址是多少?这个 MAC 地址是谁的?
因为我确定他在我旁边开了电脑,所以显然是对方防火墙阻挡了我们的访问。 ? 2.然后 ping qige.io (或者本子网外的主机都可以),同时用 Wireshark 抓这些包(可 icmp 过滤),记录一下发出帧的目的 MAC 地址以及返回帧的源 MAC 地址是多少?这个 MAC 地址是谁的?
Wireshark抓包并使用icmp过滤: 其中目的Mac是网关的。
? 3.再次 ping www.cqjtu.edu.cn (或者本子网外的主机都可以),同时用 Wireshark 抓这些包(可 icmp 过滤),记录一下发出帧的目的 MAC 地址以及返回帧的源 MAC 地址又是多少?这个 MAC 地址又是谁的?
目的Mac依旧是网关的。
问题
通过以上的实验,你会发现:
- 访问本子网的计算机时,目的 MAC 就是该主机的
- 访问非本子网的计算机时,目的 MAC 是网关的
请问原因是什么?
答:因为子网之间不需要通过网关,所以访问本子网计算机目的Mac是主机的,非子网的主机目的Mac就是网关的。
实作三 掌握 ARP 解析过程
- 为防止干扰,先使用
arp -d * 命令清空 arp 缓存
清除arp缓存需要计算机的管理员权限。不然会有以下显示:
? 2.ping 你旁边的计算机(同一子网),同时用 Wireshark 抓这些包(可 arp 过滤),查看 ARP 请求的格式以及请求的内容,注意观察该请求的目的 MAC 地址是什么。再查看一下该请求的回应,注意观察该回应的源 MAC 和目的 MAC 地址是什么。
? 3.再次使用 arp -d * 命令清空 arp 缓存
? 4.然后 ping qige.io (或者本子网外的主机都可以),同时用 Wireshark 抓这些包(可 arp 过滤)。查看这次 ARP 请求的是什么,注意观察该请求是谁在回应。
问题
通过以上的实验,你应该会发现,
- ARP 请求都是使用广播方式发送的
- 如果访问的是本子网的 IP,那么 ARP 解析将直接得到该 IP 对应的 MAC;如果访问的非本子网的 IP, 那么 ARP 解析将得到网关的 MAC。
请问为什么?
答:当本记访问本子网计算机,数据包不需要经过网关,ARP解析也是在本子网进行,所以ARP解析得到的是对方主机的MAC物理地址;而访问非子网IP会经过网关,ARP就会得到网关的MAC。
网络层
实作一 熟悉 IP 包结构
? 使用 Wireshark 任意进行抓包(可用 ip 过滤),熟悉 IP 包的结构,如:版本、头部长度、总长度、TTL、协议类型等字段。
版本:4,头部长度: 20bytes,总长度:100,TTL:116, 协议类型:TCP
问题
? 为提高效率,我们应该让 IP 的头部尽可能的精简。但在如此珍贵的 IP 头部你会发现既有头部长度字段,也有总长度字段。请问为什么?
? 答:因为通过头部长度和总长度才能完全拿到IP包的数据,不然可能无法得到正确的IP包数据,并且也能够节省传输中的时间。
实作二 IP 包的分段与重组
根据规定,一个 IP 包最大可以有 64K 字节。但由于 Ethernet 帧的限制,当 IP 包的数据超过 1500 字节时就会被发送方的数据链路层分段,然后在接收方的网络层重组。
缺省的,ping 命令只会向对方发送 32 个字节的数据。我们可以使用 ping 202.202.240.16 -l 2000 命令指定要发送的数据长度。此时使用 Wireshark 抓包(用 ip.addr == 202.202.240.16 进行过滤),了解 IP 包如何进行分段,如:分段标志、偏移量以及每个包的大小等
分析其中一个包: 其中:总长度为548,分片位移为1480,这代表分段IP包是以第1480个字节为分隔的节点,Don’t fragment为0,则代表可以被分段(1代表不能分段)。
问题
? 分段与重组是一个耗费资源的操作,特别是当分段由传送路径上的节点即路由器来完成的时候,所以 IPv6 已经不允许分段了。那么 IPv6 中,如果路由器遇到了一个大数据包该怎么办?
答:直接丢弃或者转发到支持分段的路由上。
实作三 考察 TTL 事件
? 在 IP 包头中有一个 TTL 字段用来限定该包可以在 Internet上传输多少跳(hops),一般该值设置为 64、128等。
? 在验证性实验部分我们使用了 tracert 命令进行路由追踪。其原理是主动设置 IP 包的 TTL 值,从 1 开始逐渐增加,直至到达最终目的主机。
? 请使用 tracert www.baidu.com 命令进行追踪,此时使用 Wireshark 抓包(用 icmp 过滤),分析每个发送包的 TTL 是如何进行改变的,从而理解路由追踪原理。
从第一跳开始分析:
TTL=1,
第二跳:
TTL=2,
再往下追踪,TTL依次递增。
问题
? 在 IPv4 中,TTL 虽然定义为生命期即 Time To Live,但现实中我们都以跳数/节点数进行设置。如果你收到一个包,其 TTL 的值为 50,那么可以推断这个包从源点到你之间有多少跳?
? 答:至少为50跳。
传输层
实作一 熟悉 TCP 和 UDP 段结构
? 1.用 Wireshark 任意抓包(可用 tcp 过滤),熟悉 TCP 段的结构,如:源端口、目的端口、序列号、确认号、各种标志位等字段。
分析其中一个包:
其中:源端口:60997,目的端口:20030,序列号:5521,确认号:41611,报头长度:20 bytes。
? 2.用 Wireshark 任意抓包(可用 udp 过滤),熟悉 UDP 段的结构,如:源端口、目的端口、长度等。
问题
? 由上大家可以看到 UDP 的头部比 TCP 简单得多,但两者都有源和目的端口号。请问源和目的端口号用来干什么?
? 答:一个端口可以标识一个进程,通过源端口号和目的端口号可以确定两台主机之间是哪两个进程在通信,实现数据的发送和接收。
实作二 分析 TCP 建立和释放连接
? 1.打开浏览器访问 qige.io 网站,用 Wireshark 抓包(可用 tcp 过滤后再使用加上 Follow TCP Stream ),不要立即停止 Wireshark 捕获,待页面显示完毕后再多等一段时间使得能够捕获释放连接的包。
? 2.请在你捕获的包中找到三次握手建立连接的包,并说明为何它们是用于建立连接的,有什么特征。
? 第一次握手, 客户端发送SYN=1,ACK=0标志的数据包给服务端。 ? 第二次握手,服务端发送SYN=1,ACK=1标志的数据包给发送端。 ? 第三次握手,服务端发送SYN=0,ACK=1的数据包给客户端。
? 3.请在你捕获的包中找到四次挥手释放连接的包,并说明为何它们是用于释放连接的,有什么特征。
? 释放连接时由一方发出FIN报文,另外一方接收并返回ACK报文;并且另外一方也会发送一个FIN报文,开始的那一方也接收并返回ACK报文,TCP连接被释放。
问题一
去掉 Follow TCP Stream ,即不跟踪一个 TCP 流,你可能会看到访问 qige.io 时我们建立的连接有多个。请思考为什么会有多个连接?作用是什么?
答:为了连接更稳定,传输数据更快。
问题二
我们上面提到了释放连接需要四次挥手,有时你可能会抓到只有三次挥手。原因是什么?
答:第二次和第三次挥手合并了。
应用层
应用层的协议非常的多,我们只对 DNS 和 HTTP 进行相关的分析。
实作一 了解 DNS 解析
? 1.先使用 ipconfig /flushdns 命令清除缓存,再使用 nslookup qige.io 命令进行解析,同时用 Wireshark 任意抓包(可用 dns 过滤)。
? 2.你应该可以看到当前计算机使用 UDP,向默认的 DNS 服务器的 53 号端口发出了查询请求,而 DNS 服务器的 53 号端口返回了结果。
? 3.可了解一下 DNS 查询和应答的相关字段的含义
QR:查询/应答标志。0表示这是一个查询报文,1表示这是一个应答报文 opcode,定义查询和应答的类型。0表示标准查询,1表示反向查询(由IP地址获得主机域名),2表示请求服务器状态 AA,授权应答标志,仅由应答报文使用。1表示域名服务器是授权服务器 TC,截断标志,仅当DNS报文使用UDP服务时使用。因为UDP数据报有长度限制,所以过长的DNS报文将被截断。1表示DNS报文超过512字节,并被截断 RD,递归查询标志。1表示执行递归查询,即如果目标DNS服务器无法解析某个主机名,则它将向其他DNS服务器继续查询,如此递归,直到获得结果并把该结果返回给客户端。0表示执行迭代查询,即如果目标DNS服务器无法解析某个主机名,则它将自己知道的其他DNS服务器的IP地址返回给客户端,以供客户端参考 RA,允许递归标志。仅由应答报文使用,1表示DNS服务器支持递归查询 zero,这3位未用,必须设置为0 rcode,4位返回码,表示应答的状态。常用值有0(无错误)和3(域名不存在)清除缓存
问题
你可能会发现对同一个站点,我们发出的 DNS 解析请求不止一个,思考一下是什么原因?
答:
1.DNS解析过程是先从浏览器的DNS缓存中检查是否有这个网址的映射关系,如果有,就返回IP,完成域名解析; 2.如果没有,操作系统会先检查自己本地的hosts文件是否有这个网址的映射关系,如果有,就返回IP,完成域名解析; 3.如果还没有,电脑就要向本地DNS服务器发起请求查询域名;本地DNS服务器拿到请求后,先检查一下自己的缓存中有没有这个地址,有的话直接返回; 4.没有的话本地DNS服务器会从配置文件中读取13个根DNS服务器的地址,然后向其中一台发起请求;直到获得对应的IP为止。
实作二 了解 HTTP 的请求和应答
- 打开浏览器访问 qige.io 网站,用 Wireshark 抓包(可用http 过滤再加上
Follow TCP Stream ),不要立即停止 Wireshark 捕获,待页面显示完毕后再多等一段时间以将释放连接的包捕获。
- 请在你捕获的包中找到 HTTP 请求包,查看请求使用的什么命令,如:
GET, POST 。并仔细了解请求的头部有哪些字段及其意义。
Host为主机,User-Agent为用户代理。
Accept:浏览器可接受的MIME类型。 Accept-Charset:浏览器可接受的字符集。 Accept-Encoding:浏览器能够进行解码的数据编码方式,比如gzip。 Accept-Language:浏览器所希望的语言种类,当服务器能够提供一种以上的语言版本时要用到。 Authorization:授权信息,通常出现在对服务器发送的WWW-Authenticate头的应答中。
- 请在你捕获的包中找到 HTTP 应答包,查看应答的代码是什么,如:
200, 304, 404 等。并仔细了解应答的头部有哪些字段及其意义。
100 Continue 初始的请求已经接受,客户应当继续发送请求的其余部分。(HTTP 1.1新) 200 OK 一切正常,对GET和POST请求的应答文档跟在后面。 201 Created服务器已经创建了文档,Location头给出了它的URL。 204 No Content没有新文档,浏览器应该继续显示原来的文档。 301 Moved Permanently 客户请求的文档在其他地方,新的URL在Location头中给出,浏览器应该自动地访问新的URL。 302 Moved Temporatily类似于301,但新的URL应该被视为临时性的替代,而不是永久性的。 400 Bad Request 请求出现语法错误。 401 Unauthorized客户试图未经授权访问受密码保护的页面。应答中会包含一个WWW-Authenticate头,浏览器据此显示用户名字/密码对话框,然后在填写合适的Authorization头后再次发出请求。 403 Forbidde资源不可用。服务器理解客户的请求,但拒绝处理它。通常由于服务器上文件或目录的权限设置导致。 404 Not Found无法找到指定位置的资源。这也是一个常用的应答 500 Internal Server Error服务器遇到了意料不到的情况,不能完成客户的请求。 501 Not Implemented服务器不支持实现请求所需要的功能。例如,客户发出了一个服务器不支持的PUT请求。 502 Bad Gateway服务器作为网关或者代理时,为了完成请求访问下一个服务器,但该服务器返回了非法的应答。
问题
? 刷新一次 qige.io 网站的页面同时进行抓包,你会发现不少的 304 代码的应答,这是所请求的对象没有更改的意思,让浏览器使用本地缓存的内容即可。那么服务器为什么会回答 304 应答而不是常见的 200 应答?
? 答:200应答是要完全将内容发给客服端,浏览器对网页的数据有缓存,不是每一项数据都向服务器进行请求。
|