vlambda博客
学习文章列表

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)



本篇文章大概3500字,阅读时间大约10分钟


本文主要是重点review了JDK的Selector的源码实现的细节,版本为JDK8,以期待能更好的理解Netty的线程图像。


主要拆解了:

1、I/O多路复用器跨平台的机制

2、SPI插件化开发的应用

3、Selector的register过程的本质

4、Selector的wakeup的原理

5、Windows下对Selector的select方法的优化工作,避免采坑

6、Linux下对Selector的select方法的优化工作,知根知底

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)


废话不多说,下面我从一个标准的,最简单的NIO的服务端代码编写流程开始,分析它的底层实现细节,看看它一步步到底是怎么回事儿,怎么就实现了我们所看到的那个功能,顺便验证梳理之前的一些模糊的地方。


不论怎么秀,你都得打开一个Selector,如下:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

它内部封装了一句话;

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

所以,像Netty这样的框架,就直接用的上面的方式打开一个I/O多路复用器,如下独封装一个openXX方法,目的是可以更灵活的选择到底使用哪个版本的I/O多路复用器,甚至对其做一些优化,Netty就是这么做的

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)


继续看JDK源码,先看这个SelectorProvider类的静态provider()方法都做了什么:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

它最终会返回一个provider——系统内默认的I/O多路复用器的提供者对象,个人理解它是一个脚手架,系统指的是当前JVM所在的操作系统,且全局只会生成一个provider,如果你重复调用这个方法,那么只起一次作用,所以可以认为它是单例的。


具体加载策略为:

1、先loadProviderFromProperty()尝试从系统参数里加载配置,本质是通过反射类的全限定名来获取实现类:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)


2、如果没找到,那么通过SPI(Service Provider Interface)机制,加载插件,即调用loadProviderAsService()很多框架都有这种用法,能实现服务的功能单元可插拔,解耦合的架构,简单说就是可以让用户在不修改源码的前提下,切换配置来实现切换接口的具体实现类,这就是所谓的插件化开发,比如elasticsearch的插件。实际中,虽然有框架会使用SPI的工具包实现这种机制,而不单独使用JDK的SPI,但是思想是换汤不换药的。


loadProviderAsService()如下,JDK获取Selector的策略之一,是通过SPI,它结合配置文件可以动态的获取SelectorProvider的一个实现类:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

如下是第一行代码:

ServiceLoader<SelectorProvider> sl = ServiceLoader.load(SelectorProvider.class, ClassLoader.getSystemClassLoader());

ServiceLoader这个java.util包里的工具类,会使用类加载器获取指定目录下的文件,读取该文件内容并解析,解析到所有全限定类名(就是带着完整包名的类名),然后加载对应的class文件,最后实例化对应的对象,并放入一个存储区,提供给使用者。用户需要提前在自己的插件里配置对应的目录和文件,其实就是一个jar包的META-INF/services/文件夹里创建一个以服务接口全限定名命名的配置文件,文件里写你具体实现类的全限定名。


当调用ServiceLoader.load(xxx,xxx);时,如果你提供的插件在指定的类加载器里,那么就能扫描到META-INF/services/,从而获取到你的配置里的实现类。具体细节不多说,知道插件开发这种东西是怎么回事儿就行,啥时候需要直接能用,有问题了在深入细节。


3、如果还是没找到,那么就进入兜底策略:

provider = sun.nio.ch.DefaultSelectorProvider.create();

这是JDK的I/O多路复用器跨平台的一个关键方法,即不同的操作系统create的I/O多路复用器provider的实例不一样,我的demo在win10下运行,下面看它的实现,会new一个WindowsSelectorProvider的实例:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

进入这个WindowsSelectorProvider类构造器,最终返回如下的provider:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

类图如下:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

即在Windows平台下,会给用户返回一个WindowsSelectorProvider对象。对应的,在Linux平台下,会给用户返回一个EpollSelectorProvider对象


回到demo,继续看打开I/O多路复用器的方法:

public static Selector open() throws IOException {
return SelectorProvider.provider().openSelector();
}

最终,调用的是返回的WindowsSelectorProvider对象的openSelector方法,这个open方法内部会实例化一个WindowsSelectorImpl对象,类图如下,即服务提供者和服务本身是分开设计的:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)


WindowsSelectorImpl类是rt.jar里的,该jar包含的是运行时(runtime)的核心的Java的class文件,所以这块儿源码idea只能反编译,但是看不到原始的文件。为了源码可读性,我参考的是openjdk jdk8u版本的源码


看WindowsSelectorImpl的构造器,它传入了I/O多路复用器provider

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

140行:调用父类SelectorImpl,这里没啥特殊的,是一些版本的判断,关键是看后面的代码


141行:创建了一个操作系统的poll的数组,保存Selector上注册的文件描述符(fd)以及I/O事件的标记位,初始大小INIT_CAP=8,所以在Windows上,并不是用的epoll机制:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

下面简单看看这个数组是什么东西,如下是它的实现类源码:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

最后这个new AllocatedNativeObject,会调用到如下的顶级父类——NativeObject:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

显然,JDK使用Unsafe组件申请了一块堆外内存,来实现这个数组,这个操作很危险,这相当于C的指针,使用这种方式创建的内存,必须手动回收,否则很容易OOM,所以普通用户很难直接使用这个Unsafe,注意它和Netty的Unsafe不是一回事儿,只是命名理念一致。可以参考:


至于这块儿内存的回收,如下:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)


142行:创建一个pipe对象,目的是为了实现Selector的唤醒操作。看下这个Pipe类,它很老,在1.4就有了,可见它是伴随着JDK NIO一起出现的,它是一个单向的管道数据结构,关联了一对儿Channel,一个是可写Channel,JDK叫它sinkChannel(sink),一个是可读Channel,JDK叫它sourceChannel(source)。


PS.很多流计算组件,比如Flink,也有这样的组件命名——sink和source。


具体的,当sinkChannel里有字节写入,sourceChannel就能立即按照写的顺序从sinkChannel读这些字节。知道了这个背景,继续看pipe的构建过程,如下仍然是依赖I/O多路复用器的provider创建:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

最终会实例化一个PipeImpl对象

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

进入PipeImpl,如下实现:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

到这里,就该调用native方法了,即42行的IOUtil.makepipe(true);这个方法是用C/C++语言实现,是一个原生函数,如下它位于sun/nio/ch/IOUtil.java:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

它的核心作用是为管道的sink和source关联操作系统的文件描述符(fd),并且该方法被编译成了DLL,JDK的源代码中并不包含。知道它的作用即可,即搞一个long变量(8个字节64位),在其高32位存储source fd,在低32位存储sink fd,最后返回这个long型变量pipeFds。所以在43行,会对pipeFds使用无符号右移32位,就取到了source fd,在44行,截断为int后就是sink fd,很巧妙的编码。之后经过一系列设置就准备好了pipe结构。


下面,回到WindowsSelectorImpl.java源码:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

继续,有了前面第142行的铺垫,143行直接就能依据pipe获取source fd。在146行直接获取其sinkChannel,目的是为了关闭该管道的sinkChannel的TCP协议的nagle算法,注释也写了,目的是让wakeup动作能尽快被Selector响应,前面也简单提了一下,这个pipe的设计主要是为了实现Selector的唤醒机制。


关键是第150行,将source fd,注册的感兴趣的I/O事件加入到前面已经创建的poll数组,后续就能实现Selector的wakeup方法了。因为此时注册了source fd,前面总结了,一旦sinkChannel端写入字节,sourceChannel就能立即读取,如果sourceChannel和Selector关联,就能实现类似有I/O事件就绪的效果,就能立即唤醒阻塞的Selector,原理就是这么简单。

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)


以上,发现操作系统层面的I/O多路复用器,不是在打开一个Java的Selector对象的时候创建和生效的,它仅仅是做了:

1、准备一个pipe,方便后续实现Selector唤醒操作

2、准备堆外内存数组,容纳pipe的fd,和后续可能有的fd,以及I/O事件标记


那么真正的I/O多路复用器是在哪里开始创建的呢?


这就要继续看NIO的ServerSocketChannel的创建过程,编写一个NIO的Java服务端网络程序,一定是要创建ServerSocketChannel的,如下:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

如下,进入open发现,这里果然能联系到一起,ServerSocketChannel的创建依赖了前面的SelectorProvider脚手架——WindowsSelectorImpl

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)


继续看open内部的openServerSocketChannel方法:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

内部仍然是创建了Windows平台下的一个实现,这个this参数就是前面的WindowsSelectorImpl对象,进入ServerSocketChannelImpl构造器,仍然是看openjdk的源码,参数sp就是这个WindowsSelectorImpl对象:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

关键是super的调用,看看服务端Channel是如何关联的SelectorProvider,很简单,如下,最终调用到ServerSocketChannel的抽象父类,简单赋值就完事了,而且也能看到默认的Channel都是阻塞模式:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)


该构造器ServerSocketChannelImpl剩下的逻辑就是在创建操作系统的监听套接字fd而已,不多说。


前面,在打开一个Selector,打开一个服务端的ServerSocketChannel后,下一步就是为ServerSocketChannel配置非阻塞模式,然后才能使用register方法为服务端Channel注册Selector以及I/O事件等,一般流程如下:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

这里简单看下配置阻塞Channel的过程,最终它调用的也是native方法,这个IOUtil类前面见过很多次了:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

看openjdk的Windows平台源码:

由表及里:JDK的I/O多路复用及其配套API的源码分析(上)

第141行注释清晰的写明:阻塞模式的fd,也就是Channel,无法使用register实现事件驱动。更底层的不用纠结,知道这个结论即可。比如142行的WSAEventSelect,是Windows的一个Socket的异步I/O模型,一般很少关注Windows服务器。而我的demo肯定会执行138行的分支,最终执行144行的ioctlsocket(xxx),这是一个c++函数,用来控制Socket的I/O模式,这里是设置监听套接字为非阻塞模式。


不用纠结这么底层,继续看Java实现,见下篇。


END


点亮在看,你最好看

~

阅读原文,获得更多精彩内容