?前面的博客中,提到过很多次,浏览器作为应用程序,本身是不具备向网络中发送网络请求的能力,要委托操作系统的内核协议栈来完成。协议栈再调用网卡驱动,通过网卡将请求消息发送出去,本篇博客就来探讨一下这个过程是如何实现的。
?浏览器与WEB服务器的交互,从总体上看可以分为4个阶段,具体如下:
?虽然我们说,浏览器是委托内核协议栈完成了收发消息的动作,但实际上,他们两个并不是直接交互的,和之前DNS解析器一样,浏览器会调用操作系统Socket库中的很多程序组件依次来完成上面提到的4个阶段,所以Socket库起到非常重要的作用。
?服务端程序在启动之初,会创建一个ServcerSocket实例,然后与程序的端口关联起来,然后监听端口,等待客户端连接请求的到来。
?客户端创建套接字的操作非常简单,只要浏览器调用一下Socket库中的socket()
程序组件就可以了,和之前说的调用DNS客户端组件一样。接下来socket()组件就会帮助我们创建好套接字,并且把套接字描述符返回,套接字描述符和套接字一一对应,可以理解为套接字的ID,因为在计算机中可能用多个应用程序都会发起网络请求,所以会存在很多的套接字。返回的套接字描述符会被保存在内存中。
????????<描述符> = socket(<使用IPv4>, <流模式>, ...);
?客户端在创建套接字之后,就可以拿着此套接字和服务端建立连接,进行收发数据的操作。每次客户端只要出示套接字描述符,协议栈就可以找到对应的套接字来处理消息了。
?接下来,我们需要委托协议栈来将客户端创建的套接字和服务器那边的套接字连接起来,这一步,是借助于Socket库中的connect()
组件来实现的,这个方法有三个入参,分别是:
?这里需要说明一下,套接字描述符只属于客户端或者服务端机器的,两者之间并不知道对方的套接字描述符是什么,所以通过描述符来识别对方机器上的套接字是没有意义的。
?通过调用connect()
组件,协议栈就会执行连接操作,此时客户端和服务端的套接字就连接在一起了,可以想象成一条虚拟存在的管道流。当连接成功后,协议栈就会分别将对接对方的IP地址和端口号信息保存在自己的套接字中,方便以后的数据收发操作。
?????connect(<套接字描述符>, <服务器IP地址>, <服务器端口号>, ...);
?当双方的套接字建立连接后,下面的事情就是把数据放入到套接字中,协议栈就会执行发送和接收的操作。同理,应用程序也是借助于Socket库中的组件来完成这些动作,具体过程如下:
write()
组件来完成数据的发送,由于连接阶段,我们的套接字中已经知道了服务端的IP地址和端口号,所以在识别出通讯对象后,数据就能发送到指定的服务器程序。?????write(<套接字描述符>, <发送数据>, <发送的数据长度>, ...);
read()
程序组件委托协议栈来完成的,调用read()
函数时,需要指定服务器响应消息存放的内存地址,这一地址就是接收缓冲区,而且这块内存地址是属于应用程序(浏览器)的,因此消息就相当于直接转交给了浏览器。?????read(<套接字描述符>, <接收缓冲区>, ...);
?当数据收发的过程结束,我们就需要调用Socket库中的close()
组件来完成断开阶段操作了,最终管道断开,套接字本身也会删除(套接字其实本身是一块内存)。
?Web使用的HTTP协议归档,当web服务器响应结束后,应该主动执行断开操作,之后传达到客户端,客户端的套接字也会进入到断开阶段。之后,当浏览器再调用read()
组件执行接收数据时,read()
组件会告诉应用程序数据收发操作已结束,连接已经断开,浏览器得知后,也会调用close()
进入断开阶段。
?HTTP协议将文档、图片视频等都会当成单独的对象来处理,每获取一次数据产生一次请求,就意味着创建连接、收发消息、断开连接的过程,对于同一台服务器来说显然效率是很低的。所以在后来的HTTP1.1版本中,提供了支持一次连接,收发多个请求和响应的方法,这样在一次连接后,等所有的数据请求完成后,浏览器才会主动触发断开连接的操作。
?最后总结一下,虽然我们探讨的事浏览器和服务端程序的消息收发过程,但是中间离不开Socket库的各种程序组件、内核协议栈、网卡驱动程序、网卡,只有他们相互配合,数据才能在网络中流动起来。