写博客是自己对知识梳理,目前是写给自己看,算是自己学习后的作业,也是为了养成一个良好的习惯。
前言
本篇主要是自己对线程池的原理的总结。
一、线程池基础
1. 线程池作用
解决线程频繁创建、销毁和上下文切换的CPU开销。
2. 线程池组成
2.1.线程池管理器(ThreadPool):用于创建并管理线程池,包括创建、销毁线程池,添加新任务;
2.2.工作线程(PoolWorker):线程池中线程,在没有任务时处于等待状态,可以循环的执行任务;
2.3.任务接口(Task):每个任务必须实现的接口,以供工作线程调度任务的执行,它主要规定了任务的入口,任务执行完后的收尾工作,任务的执行状态等;
2.4.任务队列(taskQueue):用于存放没有处理的任务。提供一种缓冲机制。
二、Executors的线程池
java中在JUC下有提供Executors的线程池工具类,Executors提供了五种线程池,具体如下图所示:
具体来看一下Executors几种线程池的实现:
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>());
}
public static ExecutorService newSingleThreadExecutor(ThreadFactory threadFactory) {
return new FinalizableDelegatedExecutorService
(new ThreadPoolExecutor(1, 1,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>(),
threadFactory));
}
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue<Runnable>());
}
....
阿里巴巴开发手册已经禁止了使用用Executors来创建线程池,因为它在高并发下会产生内存溢出或CPU飙高的问题,
先给出这个结论,下篇会分析一下具体的原因(不是本篇的重点)。
从上面的源码可以看到Executors工具类创建的线程都是基于以下这个接口:
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
RejectedExecutionHandler handler);
三、线程池参数
1. corePoolSize:线程池的核心线程数,即便是线程池里没有任何任务,也会有corePoolSize个线程在候着等任务;
2. maximumPoolSize:最大线程数,不管你提交多少任务,线程池里最多工作线程数;
3. keepAliveTime:线程的存活时间。当线程池里的线程数大于corePoolSize时,如果等了keepAliveTime时长还没有任务可执行,则线程退出;
4. unit:这个用来指定keepAliveTime的单位,比如秒:TimeUnit.SECONDS;
5. workQueue:一个阻塞队列,提交的任务将会被放到这个队列里;
6. threadFactory:线程工厂,用来创建线程,主要是为了给线程起名字,有默认线程工厂;
7. handler:拒绝策略,当线程池里线程被耗尽,且队列也满了的时候会调用。
四、线程池工作原理
线程池工作原理:
1. 先判断当前线程数量是否大于corePoolSize,否则创建线程来执行任务,是则会执行下一步;
2. 判断workQueue队列是否已经满了,否则将任务号缓存到队列中等待执行,是则执行下一步;
3. 判断当前线程数量是否大于maximumPoolSize,否则创建线程执行任务,是则执行下一步;
4. 会调用handler,以表示线程池拒绝接收任务。
具体的过程如下图所示:
五、拒绝策略
handler的四种拒绝策略:
1. AbortPolicy:抛出RejectedExecutionException异常,也是默认策略;
2. CallerRunsPolicy:它会在主线程中重试添加当前的任务并自动调用execute()方法;
3. DiscardOldestPolicy:抛弃旧的任务;
4. DiscardPolicy:抛弃当前的任务。
六、相关问题
1. execute和submit区别?
1.1.execte是没有返回值,submit是有同步阻塞的返回值;
1.2.execte不好捕捉异常,submit可以通过捕获Future.get抛出的异常。
2. 如何设计线程池,是否越多越好?
由于CPU的核心数有限,线程之间切换也需要开销,频繁的切换上下文会使性能降低,适得其反,可以根业务类型来设置线程数:
1.1. 业务是CPU密集:会有大量的计算,需要尽量压榨CPU性能,参考值 Ncpu+1;
1.2. 业务是IO密集:会有大量的文件读写,参考值 2 * Ncpu。
总结
1. 在有高并发下业务下,禁止使用Executors创建线程池;
2. 线程池的线程数需要参考服务器CPU的核数及业务类型(CPU密集 or IO密集)来确认。
|