常见阻塞队列
BlockingQueue 接口的实现类都被放在了JUC包中,它们的区别主要体现在存储结构上或对元素操作上的不同,但是对于take与put操作的原理,却是类似的。
队列 | 描述 |
---|
ArrayBlockingQueue | 基于数组结构实现的一个有界阻塞队列 | LinkedBlockingQueue | 基于链表结构实现的一个有界阻塞队列 | PriorityBlockingQueue | 支持按优先级排序的无界阻塞队列 | DelayQueue | 基于优先级队列(PriorityBlockingQueue)实现的无界阻塞队列 | SynchronousQueue | 不存储元素的阻塞队列 | LinkedTransferQueue | 基于链表结构实现的一个无界阻塞队列 | LinkedBlockingDeque | 基于链表结构实现的一个双端阻塞队列 |
一、ArrayBlockingQueue
1、基本概念
ArrayBlockingQueue是最典型的有界阻塞队列,先进先出,其内部采用数组(环形数组)存储元素的,初始化时需要指定容量大小,不支持扩容,利用单个ReentrantLock锁实现线程安全。
在生产者-消费者模型中使用时,如果生产速度和消费速度基本匹配的情况下,使用ArrayBlockingQueue是个不错选择;当如果生产速度远远大于消费速度,则会导致队列填满,大量生产线程被阻塞。
使用独占锁ReentrantLock实现线程安全,入队和出队操作使用同一个锁对象,也就是只能有一个线程可以进行入队或者出队操作;这也就意味着生产者和消费者无法并行操作,在高并发场景下会成为性能瓶颈。
2、源码部分
关键成员变量代码
队列初始化代码
put方法代码
take方法代码
二、LinkedBlockingQueue
1、基本概念
LinkedBlockingQueue是一个基于链表实现的阻塞队列,先进先出,默认情况下,该阻塞队列的大小为Integer.MAX_VALUE,由于这个数值特别大,所以 LinkedBlockingQueue 也被称作无界队列,代表它几乎没有界限,队列可以随着元素的添加而动态增长,但是如果没有剩余内存,则队列将抛出OOM错误。所以为了避免队列过大造成机器负载或者内存爆满的情况出现,我们在使用的时候建议手动传一个队列的大小。
LinkedBlockingQueue内部由单链表实现,只能从head取元素,从tail添加元素。LinkedBlockingQueue采用两把锁(takeLock和putLock)的锁分离技术实现入队出队互不阻塞,添加元素和获取元素都有独立的锁,即LinkedBlockingQueue是读写分离的,读写操作可以并行执行。入队时,从队尾入队,由last指针记录;出队时,由队首出队,由head指针记录。
2、源码分析
实例化代码
成员变量(两把锁)
put方法代码
take方法代码
其实这些代码都比较简单,就是单向链表的增加元素和删除链表头部元素的操作,稍微跟一下源码就行。
3、LinkedBlockingQueue与ArrayBlockingQueue对比
LinkedBlockingQueue是一个阻塞队列,内部有两个ReentrantLock来实现出入队列的线程安全,由各自的Condition对象的await和signal来实现等待和唤醒功能。它和ArrayBlockingQueue的不同点在于:
- 队列大小有所不同,ArrayBlockingQueue是有界的初始化必须指定大小,而LinkedBlockingQueue可以是有界的也可以是无界的(Integer.MAX_VALUE),对于后者而言,当添加速度大于移除速度时,在无界的情况下,可能会造成内存溢出等问题。
- 数据存储容器不同,ArrayBlockingQueue采用的是数组作为数据存储容器,而LinkedBlockingQueue采用的则是以Node节点作为连接对象的链表。
- 由于ArrayBlockingQueue采用的是数组的存储容器,因此在插入或删除元素时不会产生或销毁任何额外的对象实例,而LinkedBlockingQueue则会生成一个额外的Node对象。这可能在长时间内需要高效并发地处理大批量数据的时,对于GC可能存在较大影响。
- 两者的实现队列添加或移除的锁不一样,ArrayBlockingQueue实现的队列中的锁是没有分离的,即添加操作和移除操作采用的同一个ReenterLock锁,而LinkedBlockingQueue实现的队列中的锁是分离的,其添加采用的是putLock,移除采用的则是takeLock,这样能大大提高队列的吞吐量,也意味着在高并发的情况下生产者和消费者可以并行地操作队列中的数据,以此来提高整个队列的并发性能。
三、SynchronousQueue
SynchronousQueue是一个没有数据缓冲的BlockingQueue,其内部结构是一个链表,生产者线程对其的插入操作put必须等待消费者的移除操作take。其内部的加锁方式为CAS自旋,当自旋到一定次数后会调用LockSupport.pack()方法
如图所示,SynchronousQueue 最大的不同之处在于,它的容量为 0,所以没有一个地方来暂存元素,导致每次取数据都要先阻塞,直到有数据被放入;同理,每次放数据的时候也会阻塞,直到有消费者来取。
需要注意的是,SynchronousQueue 的容量不是 1 而是 0,因为 SynchronousQueue 不需要去持有元素,它所做的就是直接传递(direct handoff)。由于每当需要传递的时候,SynchronousQueue 会把元素直接从生产者传给消费者,在此期间并不需要做存储,所以如果运用得当,它的效率是很高的。
存在公平模式与非公平模式:
- 公平模式:TransferQueue,队尾匹配,队头出队,先进先出
- 非公平模式:TransferStack,栈顶匹配,栈顶出栈,后进先出
应用场景
SynchronousQueue非常适合传递性场景做交换工作,生产者的线程和消费者的线程同步传递某些信息、事件或者任务。
SynchronousQueue的一个使用场景是在线程池里。如果我们不确定来自生产者请求数量,但是这些请求需要很快的处理掉,那么配合SynchronousQueue为每个生产者请求分配一个消费线程是处理效率最高的办法。Executors.newCachedThreadPool()就使用了SynchronousQueue,这个线程池根据需要(新任务到来时)创建新的线程,如果有空闲线程则会重复使用,线程空闲了60秒后会被回收。
四、PriorityBlockingQueue
PriorityBlockingQueue是一个无界的基于数组的优先级阻塞队列,数组的默认长度是11,虽然指定了数组的长度,但是可以无限的扩充,直到资源消耗尽为止,每次出队都返回优先级别最高的或者最低的元素。默认情况下元素采用自然顺序升序排序,当然我们也可以通过构造函数来指定Comparator来对元素进行排序。需要注意的是PriorityBlockingQueue不能保证同优先级元素的顺序。
优先级队列PriorityQueue: 队列中每个元素都有一个优先级,出队的时候,优先级最高的先出。此处的优先级,在这个队列中是使用一个二叉堆来进行维护的,在使用二叉堆来维护数据时,我们能够很方便的获取优先级最高的元素(即堆顶的元素)。
二叉堆概念
完全二叉树:除了最后一行,其他行都满的二叉树,而且最后一行所有叶子节点都从左向右开始排序。
二叉堆:完全二叉树的基础上,加以一定的条件约束的一种特殊的二叉树。根据约束条件的不同,二叉堆又可以分为两个类型:
大顶堆和小顶堆。
- 大顶堆(最大堆):父结点的键值总是大于或等于任何一个子节点的键值,即堆顶是最大值(根节点);
- 小顶堆(最小堆):父结点的键值总是小于或等于任何一个子节点的键值,即堆顶是最小值(根节点)。
优先队列的数据逻辑
最大堆(最小堆的逻辑相同,反一下就好了):
- 添加元素时:添加的元素和堆顶元素进行比较,如果比堆顶的元素大,那么原先的堆顶元素就下浮(向下移动)。反之,则添加的元素下浮
- 弹出元素时:直接移除堆顶的元素,然后将最后面的一个叶子节点添加到堆顶的位置,然后再判断堆顶元素和它的子节点的大小关系,然后根据结果进行下浮,直至最终平衡,得到堆顶的元素依然是最大值。
源码涉及大量的算法操作,需要慢慢整理思路。有兴趣的一定要去研究它的源码,特别是涉及二叉堆赋值转换的部分。
五、DelayQueue
DelayQueue 是一个支持延时获取元素的无界阻塞队列, 内部采用优先队列 PriorityQueue 存储元素,同时元素必须实现 Delayed 接口;在创建元素时可以指定多久才可以从队列中获取当前元素,只有在延迟期满时才能从队列中提取元素。延迟队列的特点是:不是先进先出,而是会按照延迟时间的长短来排序,下一个即将执行的任务会排到队列的最前面。可以简单理解为PriorityQueue的按照时间排序的一个二叉堆。
它是无界队列,放入的元素必须实现 Delayed 接口,而 Delayed 接口又继承了 Comparable 接口,所以自然就拥有了比较和排序的能力。
六、LinkedTransferQueue
由链表结构组成的无界阻塞队列,既然是由链表组成,那么内部维护的也就是一个个Node节点,使用的是CAS+自旋的乐观锁组合。它能够自己孔子元素是否需要阻塞线程,比如使用四个添加元素的方法就不会阻塞线程,只入队元素,使用transfer()会阻塞线程。其可行可以类比SynchronousQueue队列来看。
七、LinkedBlockingDeque
基本的数据结构LinkBlockingQueue相同也是一个链表,只是该队列是一个双端队列,你可以理解为两边都是头节点,两边又都是为节点。这在操作队列中的元素时,拥有更多的可操作性。还有一点要与LinkBlockingQueue进行区别,那就是LinkedBlockingDeque的队头和队尾都是使用了同一把锁,所以在并发性上肯定不如LinkBlockingQueue。
如何选择适合的阻塞队列
线程池对于阻塞队列的选择,线程池有很多种,不同种类的线程池会根据自己的特点,来选择适合自己的阻塞队列。
- FixedThreadPool(SingleThreadExecutor 同理)选取的是 LinkedBlockingQueue
- CachedThreadPool 选取的是 SynchronousQueue
- ScheduledThreadPool(SingleThreadScheduledExecutor同理)选取的是延迟队列
选择策略
通常我们可以从以下 5 个角度考虑,来选择合适的阻塞队列:
1、功能:是否需要阻塞队列帮我们排序,如优先级排序、延迟执行等。如果有这个需要,我们就必须选择类似于 PriorityBlockingQueue 之类的有排序能力的阻塞队列。
2、容量:是否有存储的要求,还是只需要”直接传递”。在考虑这一点的时候,我们知道前面介绍的那几种阻塞队列,有的是容量固定的,如 ArrayBlockingQueue;有的默认是容量无限的,如 LinkedBlockingQueue;而有的里面没有任何容量,如 SynchronousQueue;而对于 DelayQueue 而言,它的容量固定就是 Integer.MAX_VALUE。所以不同阻塞队列的容量是千差万别的,我们需要根据任务数量来推算出合适的容量,从而去选取合适的 BlockingQueue。
3、能否扩容:有时我们并不能在初始的时候很好的准确估计队列的大小,因为业务可能有高峰期、低谷期。如果一开始就固定一个容量,可能无法应对所有的情况,也是不合适的,有可能需要动态扩容。如果我们需要动态扩容的话,那么就不能选择 ArrayBlockingQueue ,因为它的容量在创建时就确定了,无法扩容。相反,PriorityBlockingQueue 即使在指定了初始容量之后,后续如果有需要,也可以自动扩容。所以我们可以根据是否需要扩容来选取合适的队列。
4、内存结构:通过阅读ArrayBlockingQueue的源码,我们不难发现它的内部结构是“数组”的形式。和它不同的是,LinkedBlockingQueue 的内部是用链表实现的,所以这里就需要我们考虑到,ArrayBlockingQueue 没有链表所需要的“节点”,空间利用率更高。所以如果我们对性能有要求可以从内存的结构角度去考虑这个问题。
5、性能:如 LinkedBlockingQueue 由于拥有两把锁,它的操作粒度更细,在并发程度高的时候,相对于只有一把锁的 ArrayBlockingQueue 性能会更好。另外,SynchronousQueue 性能往往优于其他实现,因为它只需要“直接传递”,而不需要存储的过程。如果我们的场景需要直接传递的话,可以优先考虑 SynchronousQueue。
|