对象存活判定算法
1.引用计数算法
给对象添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1;任何时刻计数器为0的对象就是不可能再被使用的。
引用计数算法的实现简单,判定效率也很高,在大部分情况下都是一个不错的算法,但是,主流的Java虚拟机没有选用引用计数算法来管理内存,最主要的原因是它很难解决对象之间相互循环引用的问题。
2.可达性分析算法
在主流的商用程序语言的主流实现中,都是称通过可达性分析来判定对象是否存活的。
可达性分析算法基本思路就是通过一系列称为GC Roots
的对象作为起始点,从这些节点开始向下搜索,搜索所走的路径称为引用链(Reference Chain
),当一个对象到GC Roots
没有任何引用链相连时(就是GC Roots
到这个对象不可达),则证明对象不可用。
在Java中,可作为GC Roots
的对象包括:
- 虚拟机栈(栈帧中的本地变量表)中引用的对象。
- 方法区中类静态属性引用的对象。
- 方法区中常量引用的对象。
- 本地方法栈中JNI(即Native方法)引用的对象。
3.再谈引用
无论通过引用计数判断对象引用数量,还是通过可达性分析判断对象的引用链是否可达,判定对象是否存活都与“引用”有关。
在JDK1.2以前,Java的引用定义很传统:如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称这块内存代表一个引用。
在JDK1.2之后,Java对引用的概念进行了扩充,分为强引用(Strong Reference
)、软引用(Soft Reference
)、弱引用(Weak Reference
)、虚引用(Phantom Reference
)4种引用,这4种引用强度依次逐渐减弱。
- 强引用就是指在代码中普遍存在的,类似
Object obj = new Object()
这类的引用,只要强引用还存在,垃圾收集器永远不会回收被引用的对象。 - 软引用是用来描述一些还有用但并非必需的对象。对于软引用关联的对象。在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围中进行第二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常。JDK1.2之后,提供
SoftReference
类来实现软引用。 - 弱引用也是用来描述非必需的对象,它的强度比软引用更弱,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论内存是否足够,都会回收掉只被弱引用关联的对象。JDK1.2之后,提供
WeakReference
类来实现弱引用。 - 虚引用也称幽灵引用或者幻影引用,也是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用的唯一目的就是能在这个对象被收集器回收的时候收到一个系统通知。JDK1.2之后,提供
PhantomReference
类来实现虚引用。
4.生存还是死亡
即时在可达性分析算法中不可达的对象,也并非非死不可,要真正宣告一个对象死亡,至少经历两次标记过程:如果对象在进行可达性分析后发现没有与GC Roots
相连的引用链,将会被第一次标记并进行一次筛选,筛选的条件是此对象是否有必要执行finalize()
方法。当对象没有覆盖finalize()
方法,或者finalize()
已经被虚拟机调用过,虚拟机将这两种情况都视为“没有必要执行”。
如果这个对象被判定有必要执行finalize()
方法,那么这个对象会被放入一个F-Queue
队列中,并稍后由一个由虚拟机自动建立、低优先级的Finalizer
线程去执行它。这里的“执行”指虚拟机会触发这个方法,但并不承诺会运行结束,这样做的原因是,如果一个对象在finalize()
方法执行缓慢,或者发生死循环,将可能导致F-Queue
对垒中其他对象永久处于等待,甚至导致整个内存回收系统崩溃。finalize()
方法是对象逃脱死亡的最后一次机会,GC
将对F-Queue
队列中的对象进行第二次小规模的标记,如果对象要在finalize()
中成功拯救自己——只要重新与引用链上的任何一个对象建立联系即可,譬如把自己(this)赋值给某个类变量或者对象的成员变量,那么第二次标记时将被移出“即将回收的集合”;如果对象这个时候还没逃脱,基本就真的被回收了。
以下为一次对象的自我拯救:
public class FinalizeEscapeGC {
public static FinalizeEscapeGC SAVE_HOOK = null;
public void isAlive() {
System.out.println("yes, i am still alive :)");
}
@Override
protected void finalize() throws Throwable {
super.finalize();
System.out.println("finalize method executed!");
FinalizeEscapeGC.SAVE_HOOK = this;
}
public static void main(String[] args) throws Throwable {
SAVE_HOOK = new FinalizeEscapeGC();
// 对象第一次拯救自己
SAVE_HOOK = null;
System.gc();
// 因为finalize方法优先级低,暂停0.5秒等待
Thread.sleep(500);
if (SAVE_HOOK != null) {
SAVE_HOOK.isAlive();
} else {
System.out.println("no, i am dead :(");
}
// 这段代码与上面完全一致,这次自救失败
SAVE_HOOK = null;
System.gc();
// 因为finalize方法优先级低,暂停0.5秒等待
Thread.sleep(500);
if (SAVE_HOOK != null) {
SAVE_HOOK.isAlive();
} else {
System.out.println("no, i am dead :(");
}
}
}
运行结果:
finalize method executed!
yes, i am still alive :)
no, i am dead :(
从代码来看,SAVE_HOOK
对象的finalize()
方法确实被GC
收集器触发过,并且在被收集前逃脱。
另外一个值得注意的地方,代码中有两段完全相同的代码,执行结果却是一次逃脱成功,一次失败,这是因为任何一个对象的finalize()
方法都只会被系统调用一次。
5.回收方法区
在方法区中进行垃圾回收“性价比”比较低:在堆中,尤其是在新生代中,常规应用进行一次垃圾收集 一般可以回收70%~95%的空间,方法区的垃圾收集效率远低于此。
方法区主要回收两部分:废弃常量和无用的类。回收废弃常量和Java堆总共的对象非常类似。假如没有任何对象引用常量池中的常量,这时发生内存回收,并且必要的话,常量就会被系统清理出常量池。常量池中的字面量,类(接口)、方法、字段的符号引用都是如此。
判定一个类是否是“无用的类”,要同时满足以下3个条件:
- 该类所有的实例都被回收,也就是Java堆中不存在该类的任何实例。
- 加载该类的
ClassLoader
被回收。 - 该类对一个的
java.lang.Class
对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。
是否进行回收,HotSpot
提供了-Xnoclassgc
参数进行控制,还可以使用-verbose:class
以及-XX:+TraceClassLoading
、-XX:+TraceClassUnLoading
查看类加载和卸载信息,其中-verbose:class
和-XX:+TraceClassLoading
可以在Product
版虚拟机中使用,-XX:+TraceClassUnLoading
参数需要FastDebug
版虚拟机支持。
在大量使用反射、动态代理、CGLib
等ByteCode
框架、动态生成JSP
以及OSGi
这类频繁自定义ClassLoader
的场景都需要虚拟机具备卸载的功能,以保证方法区不会移出。
该文章来源《深入理解Java虚拟机》