Java类加载机制源码分析

来源：互联网发布：日本外汇储备数据编辑：程序博客网时间：2024/06/05 08:03

Java代码首先要编译成class文件字节码，在运行时通过JIT（即时编译器）编译成本地机器码，最后由ClassLoader将其加载解析成Class对象到内存中。通过ClassLoader的loadClass方法的源码加深对Java类加载机制的理解。

1. ClassLoader加载机制简述：

Java的类加载遵循父类优先的原则，也就是说ClassLoader是一个有层级的树形组合体系，并且一个ClassLoader要加载一个类，首先逐层向上检查是否有加载器加载过该类，如果有，将结果逐层返回到下级。如果没有，继续检查直到有一层ClassLoader返回没有加载并且它不应该加载，那么该层的下一层就可以加载该类。

PS：父类优先的方式也不是万能的，在JavaEE Web应用程序中，也会使用子女优先加载的方式；

1.1 JVM提供3层基本的类加载平台：

BootstrapClassLoader：加载JVM自身需要的类，注意在Hotspot JVM中它严格来说不是JVM类加载体系中的，它并不遵循上述机制，也不是下面ExtClassLoader的父类加载器；

ExtClassLoader：加载特定的类：System.getProperty("java.ext.dirs")；也就是JRE/LIB/EXT目录下的类，加载的是sun公司的一些扩展包，它是AppClassLoader的父类加载器；

AppClassLoader：加载System.getProperty("java.class.path")；就是classpath，看到这个你可能已经知道eclipse项目下.classpath的作用了，就是告诉AppClassLoader这些类由它加载；

继承自URLClassLoader的自定义类加载器，通过调用getSystemClassLoader获取自己的父加载器（AppClassLoader）；

ClassLoader的类层次结构：

图中的AppClassLoader和ExtClassLoader是Launcher的内部类；

到现在，我们可以也可以看出Java的ClassLoader使用了职责链设计模式，父优先加载，一定程度上保证了程序安全（防止恶意代码替换JSE核心类）。

1.2 JVM加载Class文件到内存的方式：

一是隐式加载：继承或引用某个类时，有JVM负责加载；

二是显式加载：在代码中调用loadClass()，Class.forName，ClassLoader的findClass方法等，显式加载中也可能包含隐式加载；

2. ClassLoader的重要方法：

findClass：主要由URLClassLoader实现，根据URLClassPath去指定地方查找class文件；取得要加载class文件的字节流；

defineCLass：可以将字节流解析成Class对象，该Class对象并未进行resolve；

resolveClass：对Class对象进行Link，载入引用类（超类，接口字段，方法签名，方法中的本地变量）；

loadClass：采用默认的加载逻辑根据类名加载一个类，返回Class对象，调用前面3个方法实现；

3. 加载class文件的过程：

3.1 加载字节码到内存：findClass和defineClass方法

首先来看看URLClassLoader中的findClass方法，因为加载的第一步，找到并获取指定class文件的字节流；

protected Class<?> findClass(final String name)            throws ClassNotFoundException    {        final Class<?> result;        try {            //获取特权，确保有权限可以读取到资源，这里            result = AccessController.doPrivileged(                    new PrivilegedExceptionAction<Class<?>>() {                        public Class<?> run() throws ClassNotFoundException {                            //将完整的类名转换成文件路径格式                            String path = name.replace('.', '/').concat(".class");                            //在指定的URLPath中获取对应的class文件资源                            Resource res = ucp.getResource(path, false);                            if (res != null) {                                try {                                    //获取成功将资源传入，最终获取未解析的Class对象                                    return defineClass(name, res);                                } catch (IOException e) {                                    //不能成功读取文件内容                                    throw new ClassNotFoundException(name, e);                                }                            } else {                                //不能获取资源                                return null;                            }                        }                    }, acc);        } catch (java.security.PrivilegedActionException pae) {            //因为要在特权操作中抛出ClassNotFoundException，使用了PrivilegedExceptionAction回调            //它会将异常包装，这里要解除包装            throw (ClassNotFoundException) pae.getException();        }        if (result == null) {            throw new ClassNotFoundException(name);        }        return result;    }

findClass方法的作用就是找到并借助defineClass方法返回Class对象（未解析），它获取特权权限去读取资源（Java安全模型对不同的代码是区分Domain的，不同的域（比如不同的项目的代码）可能对其他域的代码限制了访问自身资源的权限，具体可以参看http://www.ibm.com/developerworks/cn/java/j-lo-javasecurity/），并保证了在不同情况下可以正确的抛出ClassNotFoundException；

接下来看看findClass中使用的defineClass方法：

private Class<?> defineClass(String name, Resource res) throws IOException {        long t0 = System.nanoTime();        int i = name.lastIndexOf('.');        URL url = res.getCodeSourceURL();        //首先加载包        if (i != -1) {            String pkgname = name.substring(0, i);            // Check if package already loaded.            Manifest man = res.getManifest();            definePackageInternal(pkgname, man, url);        }        // Now read the class bytes and define the class        //使用nio，获取字节缓冲区        java.nio.ByteBuffer bb = res.getByteBuffer();        if (bb != null) {            // Use (direct) ByteBuffer:            CodeSigner[] signers = res.getCodeSigners();            CodeSource cs = new CodeSource(url, signers);            sun.misc.PerfCounter.getReadClassBytesTime().addElapsedTimeFrom(t0);            return defineClass(name, bb, cs);        } else {            //获取不到缓冲区，直接InputStream获取字节数组            byte[] b = res.getBytes();            // must read certificates AFTER reading bytes.            CodeSigner[] signers = res.getCodeSigners();            CodeSource cs = new CodeSource(url, signers);            sun.misc.PerfCounter.getReadClassBytesTime().addElapsedTimeFrom(t0);            return defineClass(name, b, 0, b.length, cs);        }    }

在这个方法中，我们可以看到对于class文件的读取策略，其中CodeSigner和CodeSource分别是代码签名和代码源，它们组合使用与前面提及的保护域机制（ProtectionDomain）当中，可见Java中类加载机制和安全模型是密不可分的。

3.2 验证和解析：defineClass方法和resovleClass方法：

defineClass首先进行：

（1）字节码验证；

（2）类准备：准备类中每个字段、方法和实现接口所需的数据结构；

protected final Class<?> defineClass(String name, byte[] b, int off, int len,                                         ProtectionDomain protectionDomain)            throws ClassFormatError    {        //首先检查类名；阻止加载“java.”开头包内的类（应有BootStrapLoader加载）；        //确保同一个包内的Class拥有相同的证书        protectionDomain = preDefineClass(name, protectionDomain);        //根据CodeSource获取一个URL的字符串表示        String source = defineClassSourceLocation(protectionDomain);        //字节码验证；类准备（准备字段，方法，实现接口所必需的数据结构）；        Class<?> c = defineClass1(name, b, off, len, protectionDomain, source);        //通过证书为该类设置签名        postDefineClass(c, protectionDomain);        return c;    }

（3）解析：resolveClass方法，直接通过一个native方法实现

进行LINK，装入引用类，如超类，接口，字段，方法中使用的本地变量。

3.3 显式加载时的过程：

调用this.getClass().getClassLoader().loadClass("className");时的过程：

首先看看URLClassLoader中的loadClass方法：

protected Class<?> loadClass(String name, boolean resolve)            throws ClassNotFoundException    {        //该getClassLoadingLock获取同步锁，该锁用并发Map保存（享元模式）        synchronized (getClassLoadingLock(name)) {            // First, check if the class has already been loaded            Class<?> c = findLoadedClass(name);            if (c == null) {                long t0 = System.nanoTime();                try {                    // 这里体现了类加载机制中的父优先的查找机制                    // 通过上滤直到parent为null                    // 这时再去BootstrapClassLoader中查找，在运行用户程序时，这一步一般都是null                    if (parent != null) {                        c = parent.loadClass(name, false);                    } else {                        c = findBootstrapClassOrNull(name);                    }                } catch (ClassNotFoundException e) {                    // ClassNotFoundException thrown if class not found                    // from the non-null parent class loader                }                if (c == null) {                    // If still not found, then invoke findClass in order                    // to find the class.                    long t1 = System.nanoTime();                    //载入字节码到内存                    c = findClass(name);                    // this is the defining class loader; record the stats                    sun.misc.PerfCounter.getParentDelegationTime().addTime(t1 - t0);                    sun.misc.PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);                    sun.misc.PerfCounter.getFindClasses().increment();                }            }            //解析连接类            if (resolve) {                resolveClass(c);            }            return c;        }    }

反映了JVM类加载机制的过程为：加载一个新类，逐层上滤检查父加载器，直到顶层（parent==null），再去BootStrapClassLoader中查找，如果返回null，就要调用findClass，resolveCass（需要的话）；

3.4 初始化Class对象：

类的静态字段，静态初始化器会按顺序赋值/执行；

上面的过程概括一下：（1）加载class文件字节码到内存——>（2）将字节码转换成未Link的Class对象（安全验证/字节码验证/类准备）——>（3）resolveClass方法Link

——>（4）类初始化；

4. 小结

本篇总结了一下Java类加载机制的机制和过程，并从源码角度加以分析。在分析源码的过程也看到了Java中的安全模型的应用，以及并发控制（findClass中的lock并发Map）

0 0