分代收集算法
就目前来讲,业界各种商业虚拟机堆内存的垃圾收集,基本上都采用了分代收集。 可想而知,分代收集算法有多么重要。 分代收集算法的思想是:
根据对象的存活周期,把内存分成多个区域,不同区域使用不同的回收算法回收对象。
堆内存结构
Java 把堆分成了"新生代"个"老年代",我们来看下图: 经过分代之后,垃圾回收可以分成以下几类:
- 新生代回收(Minor GC | Young GC)
- 老年代回收(Major GC)
- 清理整个堆(Full GC)
由于执行Major GC的时候,也会伴随着一次Minor GC,可以认为,Major GC ≈ Full GC 下面我们来看一下对象是怎么分配到堆内存的。 对象在创建的时候,会先存放到伊甸园。当伊甸园满了之后,就会触发垃圾回收。这个回收的过程是:把伊甸园中的对象拷贝到From survivor或者是To survivor里面去。 比如说,第一次回收把对象拷贝到From survior里了,那么下一次回收就会把存活的对象从From survior拷贝到To survior,再下一次就会把To survior里的对象拷贝到From surivor,周而复始。那么不难发现,这个过程使用了复制算法,这也就是为什么新生代要有两个survior的原因。 那么对象每经历一次垃圾回收之后,那么还存活的话,他的年龄就会加一。当对象的年龄达到阈值的话(默认是15),就会晋升到老年代,老年代里的对象存活率是比较高的。
老年代一般是采用标记清除或者标记整理的思想进行回收。
注意
这里需要说明一下,这里的过程只是一个典型的分配流程。实际情况是存在例外的:
- 新建的对象不一定会分配到伊甸园,也有可能直接分配到老年代
这里主要分为两种场景:
- 对象大于-XX:PretenureSizeThreshold(默认是0),就会直接分配到老年代
- 新生代空间不够
如果你的对象非常的大,比如是一个超大数组,新生代的空间根本不够,那么这个时候也会直接放到老年代。因为新生代采用的是复制算法,在伊甸园分配大对象的话将会导致伊甸园和两个survior区大量的内存拷贝。 - 对象不一定要达到年龄才进入老年代
虚拟机有一个动态年龄 的概念,如果Survior空间中所有相同年龄大小的总和大于Survivor空间的一半,那么年龄大于等于该年龄的对象就可以直接进老年代。
垃圾回收的触发条件
新生代(Minor GC)触发条件
伊甸园空间不足,就会进行Minor GC回收新生代
老年代(Full GC)触发条件
- 老年代空间不足
- 元空间不足
- 要晋升老年代的对象所占用的空间大于老年代的剩余空间。
- 显式调用System.gc()
- 建议垃圾回收器执行垃圾回收
- -XX: +DisableExplicitGC 参数,忽略掉System.gc()的调用
总结
分代收集算法是根据对象的生命周期,把内存作分代,然后在分配对象的时候,不同生命周期的对象放在不同的代里面,不同的代上使用合适的回收算法进行回收,比方说,新生代里面的对象存活周期一般都比较短,每次垃圾回收的时候都会发现有大量的对象死去,所以新生代可以使用复制算法来完成垃圾收集。而老年代里的对象存活率比较高,所以就采用标记清除或者标记整理进行回收。
那么相比单纯的标记清除、标记整理、复制算法,分代带来了什么好处呢?
- 分代可以更有效的清除不需要的对象。
- 提升了垃圾回收的效率
最后,我们来总结一下分代收集算法的调优原则:
- 合理设置Survivor区域大小,避免内存浪费
因为Survivor区对内存的利用率不高,如果配置过大,内存浪费就会比较严重。 - 让GC尽量发生在新生代,尽量减少Full GC的发生
再和大家介绍一下相关JVM的参数,大家可以先留个印象,后续我会在后面的博文中详细介绍每个参数的作用,以及如何调优:
参数 | 作用 | 默认 |
---|
-XX:NewRatio=n | 老年代:新生代内存大小比值 | 2 | -XX:SurvivorRatio=n | 伊甸园:survivor区内存大小比值 | 8 | -XX:PretenureSizeThreshold=n | 对象大于该值就会在老年代分配,0表示不限制 | 0 | -Xms | 最小堆内存 | - | -Xmx | 最大堆内存 | - | -Xmn | 新生代大小 | - | -XX:+DisableExplicitGC | 忽略掉System.gc()的调用 | 启用 | -XX:NewSize=n | 新生代初始内存大小 | - | -XX:MaxNewSize=n | 新生代最大内存 | - |
|