TCP/IP详解——IP协议,IP选路

发布时间:2023年12月17日

1. IP 编址

IP 概述

  • IP是TCP/IP协议族中最为核心的协议,所有的TCP,UDP,ICMP,IGMP数据都是以IP数据报格式进行传输的。
  • IP提供不可靠的,无连接的数据报传送服务
  • 不可靠(unreliable)的意思是它不能保证IP数据报能成功地到达目的地。IP 仅提供最好的传输服务。如果发生某种错误时,如某个路由器暂时用完了缓冲区,IP 有一个简单的错误处理算法:丢弃该数据报,然后发送 ICMP 消息报给信源端。任何要求的可靠性必须由上层来提供(如TCP)。
  • 无连接(connectionless)这个术语的意思是IP并不维护任何关于后续数据报的状态信息。每个数据报的处理是相互独立的。IP数据报可以不按发送顺序接收。如果一信源向相同的信宿发送两个连续的数据报(先是A,然后是B),每个数据报都是独立地进行路由选择,可能选择不同的路线,因此B可能在A到达之前先到达。
  • 命令:ifconfignetstat

1.1 IP 报文头部

image-20230718153105710

image-20231113153421311

image-20231113154401900

说明

  • **版本字段(Version):**用于区分不同IP协议的版本。如IPv4、IPv6,用4bit表示(4位),IPV4头部为0100(4),IPV6头部为0110(6)。

  • **首部长度(Header Length):**因为头部长度不固定(IP首部的选项部分 Option 不固定),所以需要标识该分组的头部长度用4bit表示(4位),以4byte为单位,取值范围:5-15,即20-40byte(其他字段也是类似的计算方式,因为bit位是不够表示该字段的值)。

    • 确定IP首部的结束位置:通过首部长度字段,接收方能够确定整个IP首部的结束位置,从而能够准确地找到IP数据包中的数据部分的起始位置。
  • DS Field字段:早期用来表示业务类型,现在用于支持QoS中的差别服务模型,实现网络流量优化

    • DSCP(Differentiated Services Code Point)占据了前6位,用于标识数据包的优先级和处理方式。它通过定义一系列编码值来实现不同类型数据流的区分。这些编码值可以被用来指定数据包的转发优先级、队列处理方式等,以便网络设备能够根据这些值对数据包进行适当的处理。
    • ECN(Explicit Congestion Notification)占据了后2位,用于指示网络中的拥塞情况。当网络出现拥塞时,数据包的ECN位会被设置以通知接收方网络的拥塞状态,从而触发相应的拥塞控制机制。
  • Total Length总长度:长16位,描述了 IP 数据包头部和后续数据的总长度,最大可达到 65535 的一个长度,当数据包被分片的时候该字段的值也随着变化。

    image-20231118094327427

  • 标识 Identification:16位长度,每一个IP包都有标识。便于在IP包分片后,判断是否是一个数据包

  • **源和目的IP地址:**是分配给主机的逻辑地址,用于在网络层标识报文的发送方和接收方。根据源IP地址和目的IP地址可以判断目的端是否与发送端位于同一网段,如果二者不在同一网段,则需要采用路由机制进行跨网段转发。

Wireshark抓包查看

image-20231113163216033

1.2 进制之间的转换

image-20230718153743193

image-20230718153754911

1.3 网络通信

image-20230718153918633

说明:源主机必须知道目的主机的ip地址才能将数据发送到目的地,源主机向其他主机发送报文之前,需要检查目的IP地址和源主机IP地址是否处于同一网段,如果是则将报文下发到底层的协议进行以太网的封装处理。如果目的地址和源主机地址不属于同一个网段,则主机需要获取下一跳路由的IP地址才能将报文下发到底层的协议处理。

1.4 有类 IP 编制的缺陷

image-20230718154245104

如果企业网络中希望通过规划多个网段来隔离物理网络上的主机,使用缺省子网掩码就会存在一定的局限性。网络中划分多个网段后,每个网段中的实际主机数量可能很有限,导致很多地址未被使用

如图所示的场景下,C类地址的缺省子网掩码为24位,可以支持254台这主机,而图中只有30台主机,如果使用缺省子网掩码的编址方案,则地址使用率很低

128 64 32 16 8 4 2 1

1 1 1 0 0 0 0 0

第一个子网

网络地址:192.168.1.0

第一个IP地址:192.168.1.1

最后一个IP地址:192.168.1.30

广播地址:192.168.1.31

第二个子网

网络地址:192.168.1.32

第一个IP地址:192.168.1.33

最后一个IP地址:192.168.1.62

广播地址:192.168.1.63

第三个子网

网络地址:192.168.1.64

第一个IP地址:192.168.1.65

最后一个IP地址:192.168.1.94

广播地址:192.168.1.95

1.5 变长子网掩码

image-20230718155725376

可变长子网掩码缓解了使用缺省子网掩码导致的地址浪费问题,同时也为企业网络提供了更为有效的编址方案。本例中需要使用可变长子网掩码来划分多个子网,借用一定数量的主机位作为子网位的同时,剩余的主机位必须保证有足够的IP地址供每个子网上的所有主机使用。

例如:公司有C类网段192.168.1.0/24,目前有以下几个部门:

  • 销售部 59台
  • 技术部 27台
  • 业务部 121台
  • 会计部 10台

需求是将一个C类网段合理分配给如下几个部门,保证地址合理分配

销售部地址范围:

子网掩码:255.255.255.192

子网范围:192.168.1.128~192.168.1.191

技术部地址范围:

子网掩码:255.255.255.224

子网范围:192.168.1.192~192.168.1.223

业务部地址范围:

子网掩码:255.255.255.128

子网范围:192.168.1.0~192.168.1.127

会计部地址范围:

子网掩码:255.255.255.240

子网范围:192.168.1.224~192.168.1.241

1.6 网关

image-20230718155757041

在没有路由器的情况下,两个网络之间的主机是不能进行TCP/IP通信的,即使是两个网络连接在同一台交换机,TCP/IP协议也会根据子网掩码(255.255.255.0)与主机的IP 地址作 “与” 运算的结果不同判定两个网络中的主机处在不同的网络里。

要实现这两个网络之间的通信,则必须通过网关。如果主机A发现数据包的目的主机不在本地网络中,就把数据包转发给它自己的网关(在封装MAC地址的时候是封装的是网关的MAC地址),再由网关转发给主机B的网关。

网关由管理员设置,从主机地址中随机挑选一个作为网关地址。

1.7 IP 包分片

只有UDP的数据包才会有分片

  • IP把MTU与数据报长度进行比较。
  • 如果需要则进行分片,分片可以发生在原始发送端主机,也可以发生在中间的路由器上
  • 把一份IP数据报分片以后,只有到达目的地才进行重新组装。(FRfragment)
  • 重新组装由目的端的IP层来完成,其目的是使分片和重新组装过程对传输层(TCP和UDP)是透明的。
  • 已经分片过的数据报有可能会再次进行分片(可能不止一次)

image-20230718155829666

image-20231113154516882

网络中转发的IP报文的长度可以不同,但如果报文长度超过了数据链路所支持的最大长度,则报文需要分割成若干个较小的片段才能够在链路上传输。将报文分割成多个片段的过程叫做分片

说明

接收端根据分片报文中的标识符(Identification)标志(Flags),及片偏移(Fragment Offset)字段对分片报文进行重组

  • Identification:标识符,用于识别属于同一个数据包的分片,以区别于同一主机或其他主机发送的其它数据包分片,保证分片被正确的重新组合。

    • Identification该字段还在流量分析中也会起到重要的意义。例如在防火墙之前和之后去抓取同一个会话,那么数据在经过防火墙后,其源IP地址和目的IP地址甚至是端口可能都已经被改变了。很难去分辨在防火墙前和防火墙后是否是同一组流量。那么就可以使用Identification这个字段进行判断,因为Identification值是一样的。

    • 标识字段唯一的标识主机发送的每一份数据报,通常每发送一个报文,它的值就会加1。

  • Flags:标志字段,用于判断是否已经收到最后一个分片。(最后一个分配的标志字段(flag)值为0,其他分片设置为1

    • CU位:当前没有使用。
    • DF位:当该位置1的时候,表示禁止对本数据包进行分片操作。
    • MF位:当该位置1的时候,表示该数据包片段并不是数据包末尾,也就是“更多的片”,其他每个组成数据报的片都要把该比特置为1。
  • Fragment Offset:片偏移,原始分片中的位置。标识某个分片在分组中的位置。第一个分片的片偏移为0,第二个分片的片偏移表示紧跟第一个分片后的第一个比特的位置。比如,如果首片报文包含1259比特,那么第二片报文的片偏移字段值就应该为1260。

image-20231120155421263

当IP数据报被分片后,每一片都成为一个分组,具有自己的IP首部,并在选择路由时与其他分组独立。这样,当数据报的这些分片到达目的端时有可能会失序,但是在IP首部中有足够的信息让接收端能正确组装这些分片。

尽管IP分片过程看起来是透明的,但是有一个点:即使只丢失一片数据也要重新传递整个数据报

IP层本身没有超时重传的机制一一由更高层来负责超时和重传(TCP有超时和重传机制,但UDP没有。一些UDP应用程序本身也执行超时和重传)。当来自TCP报文段的某一片丢失后,TCP在超时后会重发整个TCP报文段,该报文段对应于一份IP数据报。没有办法只重传据报中的一个数据报片

如果对数据报分片的是中间路由器,而不是起始端系统,那么起始端系统就无法知道数据报是如何被分片的。就这个原因,经常要避免分片。

1.7.1 IP 包分片实例

使用UDP很容易导致IP分片,而TCP不会产生IP分片。这是因为TCP限制了传给IP层数据的长度,使IP数据报的长度不会超过路径MTU。

image-20231120155421263

假设网络的MTU为1500字节。当发送一份数据长度为1473字节的UDP数据报时,封装成的IP数据报的长度为1501(1473+8+20)字节,大于路径的MTU值。于是IP层进行分片,一份IP数据报被分成两个分组,其中一个分组包含1472字节数据,另一个分组包含1字节数据。

1.7.2 IP 分片注意事项

  • 在分片的时候,除了最后一片外,其他每一片中的数据部分(除 IP 首部外的其余部分)必须是8字节的整数倍
  • IP 首部被复制到各个片中。但是端口号在UDP首部,只能在第1片中被发现
  • IP 数据报是指 IP 层端到端的传输单元(在分片之前和重新组装之后),分组是指在 IP 层和链路层之间传送的数据单元。一个分组可以是一个完整的 IP 数据报,也可以是 IP 数据报的一个分片。

1.7.3 Wireshark 抓取 IP 包分片

执行ping命令

ping -l 2000 192.168.188.133 -n 1

命令解析:

  • -n:表示只发送一个数据包。
  • -l:表示指定数据报中的数据(不包含IP首部和ICMP首部),这里是2000字节。

image-20231120170901287

在虚拟机中进行抓包查看:

image-20231120172007100

说明:

  • DF位为0表示该数据报可以被分片。

  • 以太网帧的数据大小最多要求1500个字节,其中IP头部占20个字节,ICMP头部占8个字节。数据部分就只剩下1472个字节了。

  • 1472+528=2000。

抓取不分片的数据包

ping -l 1472 192.168.188.133 -n 1

image-20231120172321418

image-20231120172358881

1.7.4 OmniPeek 抓取 IP 包分片

image-20231121155456641

OmniPeek 抓包查看

image-20231121154557865

第一个分片

image-20231121154858178

第二个分片

1500-20个字节的IP首部=1480数据部分

image-20231121154827253

第三个分片

image-20231121154933441

第四个分片

image-20231121155003111

数据长度为1472+1480+1480+568=5000。

1.7.5 ICMP 不可达差错(需要分片)

ICMP 不可达差错需要分片。

image-20231120173216926

  • 发生ICMP不可达差错的另一种情况是,当路由器收到一份需要分片的数据报,而在IP首部又设置了不分片(DF)位。该差错报文的格式如上。
  • 如果程序需要判断到达目的端的路径中最小MTU是多少,那么这个差错就可以被该程序使用。
  • 下一站点网络的MTU字段有些操作系统可能不支持。

image-20231120173656848

思科路由器会支持显示下一站网络的MTU。

image-20231120175002370

1.7.6 实例

image-20231120195947491

  • 在点到点的链路中,不会去要求两个方向的MTU为相同的值。
  • 在主机sun上运行tcpdump,观察SLIP链路,看什么时候发生分片。开始没有观察到分片,一切都很正常直到ping分组的数据长度从500增加到600字节。可以看到接收到的回显请求(仍然没有分片),但不见回显应答。
  • Ping的时候DF置位为0。

解析:主机solaris在和主机bsdi通信的时候,数据长度设置为600字节,在主机netb的MTU值是大于600的所以是可以通过并不需要就行分片操作。而主机sun的路径MTU是552(ping程序检查的出接口,这个MTU=552是入接口,所以在去的时候是不需要分片的)。但是在回来的时候由于MTU值是大于600,所以主机sun这里的出接口是过不来的。看不见回显应答,返回一个ICMP 不可达差错报文,不会返回给主机solaris,而是返回给主机bsdi。

1.8 生存时间/首部校验和

image-20230718160504201

image-20231113155712331

说明

  • Time to Live 生存周期:数据包每经过一个三层设备转发就将TTL值减1,当生存周期TTL为0时,向源IP地址发送ICMP错误消息。不同都操作系统的默认TTL值不同,Linux中的TTL值位64,Windows中的TTL值为128。(但是这个TTL值是可以修改的,只能是作为一个参考)

    • 并且有时候每个方向的TTL值是不一样的,有可能发包的时候TTL值是128,返回可能TTL值是255。

      image-20231118101344163

  • Header Checksum 首部校验和:长16位,只对IPv4头部进行校验,如果出现错误则丢弃数据包。

    • 首部检验和字段是根据IP首部计算的检验和码。它不对首部后面的数据进行计算。ICMP、IGMP、UDP和TCP在它们各自的首部中均含有同时覆盖首部和数据检验和码。

数据包在网络中传输为什么会出现拥塞

  • 报文在网段间转发时,如果网络设备上的路由规划不合理,就可能会出现环路,导致报文在网络中无限循环,无法到达目的端。环路发生后,所有发往这个目的地的报文都会被循环转发,随着这种报文逐渐增多,网络将会发生拥塞

TTL解决环路导致拥塞

  • 为避免环路导致的网络拥塞,IP报文头中包含一个生存时间TTL(Time To Live)字段。报文每经过一台三层设备,TTL值减1。初始TTL值由源端设备设置(自己设置)。当报文中的TTL降为0时,报文会被丢弃。同时,丢弃报文的设备会根据报文头中的源IP地址向源端发送ICMP错误消息

Ping是ICMP协议

1.9 协议位

协议字段被 IP 用来对数据报进行分用,根据它可以识别是哪个协议向IP传送数据。

image-20230718161007098

目的端的网络层在接收并处理报文以后,需要决定下一步对报文该做如何处理。IP报文头中的**协议字段(Protocol)**标识了将会继续处理报文的协议。与以太帧头中的Type字段类似,协议字段也是一个十六进制数。

IP报文头中的协议字段也标识上层协议如

  • ICMP 控制消息协议,对应值0x01

  • TCP 传输控制协议,对应值0x06

  • UDP 用户数据报协议,对应值0x17

image-20231118101619424

image-20231118101711997

1.10 IP 首部的选项

最后一个字段是选项,它是数据报中的一个可变长的可选信息。选项字段以32位作为界限,在必要的时候插入值为0的填充字节。这样就保证IP首部长度始终是32位的整数倍(这是首部长度字段所要求的)。

有如下几个选项:

  • 记录路径(让每个路由器都记下它的IP地址)。
  • 时间戳(让每个路由器都记下它的IP地址和时间)。
  • 宽松的源站选路(为数据报指定一系列必须经过的IP地址)。
  • 严格的源站选路(与宽松的源站选路类似,但是要求只能经过指定的这些地址,不能经过其他的地址)。

这些选项很少被使用,并非所有的主机和路由器都支持这些选项。选项字段一直都是以32bit作为界限,在必要的时候插入值为0的填充字节。这样就保证IP首部始终是32bit的整数倍(这是首部长度字段所要求的)。

1.11 IP 路由选择

数据报从主机bsdi到sun的传送过程。

image-20231130155747508

查询路由的过程

  • 策略明细路由
  • 明细路由
  • 策略默认路由
  • 默认路由

image-20231118104646519

image-20231118104713903

1.12 特殊情况的 IP 地址

image-20231118211923573

  • 在这个图中,0表示所有的比特位全为0。-1表示所有的比特位全为1。netid、subnetid和hostid分别表示不为全0或全1的对应字段。子网号栏为空表示该地址没有进行子网划分。
  • 表的头两项是特殊的源地址,中间项是特殊的环回地址,最后四项是广播地址。
  • 表中的头两项,网络号为0,如主机使用BOOTP协议确定本机IP地址时只能作为初始化过程中的源地址出现。

DHCP的源IP地址就是0.0.0.0 。

image-20231118110343208

127.0.0.1是环回地址,但是127后面随便写都是环回地址。

2. IP 选路

IP选路的原理涉及计算机网络中的路由协议和路由表。当数据包到达路由器时,路由器需要决定将数据包发送到哪个接口以及下一跳的地址是什么。

除了传统的路由选择方式外,还可以通过使用IP选路选项(如IP源站选路选项),来指定数据包的传输路径,以实现特定的路由策略和行为控制。

2.1 IP 选路概念

选路是IP最重要的功能之一。下图是IP层处理过程的简单流程。需要进行选路的数据报可以由本地主机产生,也可以由其他主机产生。在后一种情况下,主机必须配置成一个路由器,否则通过网络接口接收到的数据报,如果目的地址不是本机就要被丢弃(例如,悄无声息地被丢弃)。

在下图中,描述了一个路由守护程序( daemon),通常这是一个用户进程。在Unix系统中,大多数普通的守护程序都是路由程序和网关程序(术语 daemon指的是运行在后台的进程,它代表整个系统执行某些操作。 daemon一般在系统引导时启动,在系统运行期间一直存在)。在某个给定主机上运行何种路由协议,如何在相邻路由器上交换选路信息,以及选路协议是如何工作的,所有这些问题都是非常复杂的。

下图所示的路由表经常被IP访问(在一个繁忙的主机上,一秒钟内可能要访问几百次),但是它被路由守护程序更新的频度却要低得多(可能大约30秒种一次)。当接收到ICMP重定向,报文时,路由表也要被更新。

路由守护程序:动态路由协议RIP协议,OSPF协议。

2.2 选路原理

开始讨论 IP 选路之前,首先要理解内核是如何维护路由表的。路由表中包含的信息决定了 IP 层所做的所有决策

IP 搜索路由表的几个步骤:

  • 搜索匹配的主机地址;

  • 搜索匹配的网络地址;

  • 搜索默认表项(默认表项一般在路由表中被指定为一个网络表项,其网络号为 0)。

匹配主机地址步骤始终发生在匹配网络地址步骤之前。

IP层进行的选路实际上是一种选路机制,它搜索路由表并决定向哪个网络接口发送分组。(可以添加路由表)

这区别于选路策略,它只是一组决定把哪些路由放入路由表的规则。 IP 执行选路机制,而路由守护程序则一般提供选路策略

2.3 简单路由表

下图是“srv4”主机的路由表:

image-20231120100423983

对于一个给定的路由器,可以打印出五种不同的标志( flag):

  • U 该路由可以使用。
  • G 该路由是到一个网关(路由器)。如果没有设置该标志,说明目的地是直接相连的。
  • H 该路由是到一个主机,也就是说,目的地址是一个完整的主机地址。如果没有设置该标志,说明该路由是到一个网络,而目的地址是一个网络地址:一个网络号,或者网络号与子网号的组合。
  • D 该路由是由重定向报文创建的。
  • M 该路由已被重定向报文修改。

标志G是非常重要的,因为由它区分了间接路由直接路由(对于直接路由来说是不设置标志G的)。其区别在于:发往直接路由的分组中的IP地址是目的端的IP地址,链路层地址是目的端的链路层地址。而当分组被发往一个间接路由时,分组中的IP地址还是目的端的IP地址,但是链路层地址却是网关(即下一跳路由器)的链路层地址

链路层地址也称为MAC地址。

image-20231120102803036

Linux下查看路由表

netstat -rn

image-20231120102457953

Windows下查看路由表

route print
netstat -r

image-20231120100545041

2.4 路由查找失败

如果路由表中没有默认表项,而又没有找到匹配项,这时会发生什么情况呢?结果取决于该IP数据报是由本机产生的还是被转发的(主机充当一个路由器)。如果数据报是本机产生的,那么就给发送该数据报的应用程序返回一个错误,或者是“主机不可达差错”或者是“网络不可达差错”。如果是被转发的数据报,那么就给发送该数据报的主机发送一份ICMP主机不可达的差错报文。

2.5 ICMP 重定向差错

image-20231120104034278

  1. 假定主机发送一份IP数据报给R1(R1是主机的默认网关)。
  2. R1收到数据报并且检查它的路由表,发现R2是发送该数据报的下一跳。当它把数据报发送给R2时,R1检测到它正在发送的接口与接收到数据报的接口是相同的。
  3. R1发送一份ICMP重定向报文给主机,告诉它以后把数据报发送给R2而不是R1。

一旦默认路由发生差错,默认路由器将通知它进行重定向,并允许主机对路由表作相应的改动。

ICMP 重定向报文的格式如下:

image-20231120105709176

ICMP重定向报文的接收者(主机)必须查看三个IP地址:

1. 导致重定向的IP地址(即ICMP重定向报文中包含的IP首部中的目的IP地址)。(目的IP地址)
2. 发送重定向报文的路由器的IP地址(IP数据报首部中的源IP地址)。(网关)
3. 应该采用的路由器IP地址(ICMP重定向报文中的4~7字节)。(优化的网关)

image-20231120110608370

ICMP 重定向数据包

image-20231120112448256

在这里插入图片描述

R1去往2.2.2.2的时候要走202.100.1.2这个IP

2.6 重定向的条件

在生成ICMP重定向报文之前这些条件需要满足:

  • 出接口必须等于入接口。
  • 用于向外传送数据包的路由不能被ICMP重定向报文创建或者修改过,而且不能是路由器的默认路由。
  • 数据包不能用源站选路来转发。
  • 内核必须配置成可以发送重定向报文。
  • 在修改路由表之前要作一些检查。这是为了防止路由器或主机的误操作,以及恶意用户的破坏,导致错误地修改系统路由表。
  • 新的路由器必须直接与网络相连接。
  • 重定向报文必须来自当前到目的地所选择的路由器。
  • 重定向报文不能让主机本身作为路由器。
  • 被修改的路由必须是一个间接路由。
文章来源:https://blog.csdn.net/weixin_58783105/article/details/134963136
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。