Java泛型原理详解

来源:互联网 发布:办公软件图标 编辑:程序博客网 时间:2024/05/22 14:03

       在Java 5时,引入了泛型,本文主要从原理的层面上分析泛型。

泛型的作用


为什么需要引入泛型呢?泛型有什么样的作用呢?先看段代码

public class Fruits {    Fruits fruits;    protected void set(Fruits item){        fruits = item;    }    protected Fruits get(){        return fruits;    }}public class Apple extends Fruits {    private static final String name = "apple";}public class Orange extends Fruits {    private static final String name = "orange";}private void addFruit() {    Fruits fruits = new Fruits();    fruits.set(new Apple());    Apple apple = (Apple) fruits.get();    Orange orange = (Orange) fruits.get();//强制转换崩溃}

水果类Fruits,有set()和get()设置水果和取出水果,Apple和Orange分别是Fruits的子类,在addFruit()添加一个Apple,然后通过get()取出来,在取出来的水果转换为Orange的时候,会抛出ClassCastException。

上述的代码在语法上是可以的,导致编译器无法检查出类型转换非法的问题,而在运行时会导致强制转换失败而导致崩溃。而泛型的作用就是用来在编译时来进行类型安全检查,能够让开发人员在编译的时候能够检查出非法的类型。

编译时泛型


不知道大家有没有听过“Java伪泛型”或者“编译时泛型”的说法。这两种说法都体现了Java的泛型只是在编译时期起作用,对于运行时没有任何影响。由编译器来执行类型安全检查和类型推断,然后生成非泛型的字节码。而虚拟机无法感知到泛型的存在,这种实现方式叫做擦除(erasure)。那接下来从泛型的编译时类型安全检查和擦除性来分析。

1.编译时类型安全检查

修改上面的代码Fruits为GenericFruits,通过泛型实现,具体代码如下

public class GenericFruits<T> {    T fruits;    protected void set(T item) {        fruits = item;    }    protected T get() {        return fruits;    }}private void addFruit() {    GenericFruits<Apple> fruits = new GenericFruits<>();    fruits.set(new Apple());    Apple apple = fruits.get();    Orange orange = (Orange) fruits.get();//编译无法通过}

同样是在addFruit()添加一个Apple,然后通过get()取出来,在取出来的水果转换为Orange,此时代码编译无法通过,泛型设置的是Apple,而当把它强制转化为Orange的时候,编译器检查到非法类型转换,提示编译错误Inconvertible types: “xxx.Apple” to “xxx.Orange”。

2.泛型类型擦除

既然泛型是由编译器来执行类型安全检查和类型推断,然后生成非泛型的字节码,而虚拟机无法感知到泛型的存在。那么我们反编译APK来看看编译之后是怎样的。
通过apktool反编译,得到Apple、GenericFruit等smail文件,直接上GenericFruit的smail代码

.class public Lcom/example/forone/genericdemo/GenericFruits;.super Ljava/lang/Object;.source "GenericFruits.java"# annotations.annotation system Ldalvik/annotation/Signature;    value = {        "<T:",        "Ljava/lang/Object;",        ">",        "Ljava/lang/Object;"    }.end annotation# instance fields.field fruits:Ljava/lang/Object;    .annotation system Ldalvik/annotation/Signature;        value = {            "TT;"        }    .end annotation.end field# direct methods.method public constructor <init>()V    .locals 0    .prologue    .line 8    .local p0, "this":Lcom/example/forone/genericdemo/GenericFruits;, "Lcom/example/forone/genericdemo/GenericFruits<TT;>;"    invoke-direct {p0}, Ljava/lang/Object;-><init>()V    return-void.end method# virtual methods.method protected get()Ljava/lang/Object;    .locals 1    .annotation system Ldalvik/annotation/Signature;        value = {            "()TT;"        }    .end annotation    .prologue    .line 17    .local p0, "this":Lcom/example/forone/genericdemo/GenericFruits;, "Lcom/example/forone/genericdemo/GenericFruits<TT;>;"    iget-object v0, p0, Lcom/example/forone/genericdemo/GenericFruits;->fruits:Ljava/lang/Object;    return-object v0.end method.method protected set(Ljava/lang/Object;)V    .locals 0    .annotation system Ldalvik/annotation/Signature;        value = {            "(TT;)V"        }    .end annotation    .prologue    .line 13    .local p0, "this":Lcom/example/forone/genericdemo/GenericFruits;, "Lcom/example/forone/genericdemo/GenericFruits<TT;>;"    .local p1, "item":Ljava/lang/Object;, "TT;"    iput-object p1, p0, Lcom/example/forone/genericdemo/GenericFruits;->fruits:Ljava/lang/Object;    .line 14    return-void.end method

smail代码比较长,挑重点来看

# instance fields.field fruits:Ljava/lang/Object;    .annotation system Ldalvik/annotation/Signature;        value = {            "TT;"        }    .end annotation.end field

这是定义字段fruits,我们看到后面的Ljava/lang/Object;编译之后fruits变为了Object类型,那再看看get()与set()方法是怎样的呢?

# virtual methods.method protected get()Ljava/lang/Object;//get()的返回类型为object    .locals 1    .annotation system Ldalvik/annotation/Signature;        value = {            "()TT;"        }    .end annotation    /...省略部分代码.../    return-object v0.end method.method protected set(Ljava/lang/Object;)V//set()的参数类型也为Object    .locals 0    .annotation system Ldalvik/annotation/Signature;        value = {            "(TT;)V"        }    .end annotation/...省略部分代码.../    return-void.end method

从上面的代码中发现,get()的返回类型变为了object,同时set()的返回类型也成了Object,参数fruits也变成了Object。将泛型中的T类型变成了Object,而虚拟机运行的时候将泛型参数变成了Object来处理,无法感知到泛型的存在,这就是泛型类型的擦除性质。

既然编译的时候泛型类型参数被转换为了Object,那看看下面这段代码

   private void addGenericFruit() {        GenericFruits<Apple> fruits = new GenericFruits<>();        fruits.set(new Apple());        Apple apple = fruits.get();    }

其中Apple apple = fruits.get();并不需要进行强制转换为Apple,那么就有一个疑问,什么时候将Object转化为Apple的呢?继续看上面这段代码反编译之后的代码

.method private addGenericFruit()V      /...省略部分代码.../    .line 26    invoke-virtual {v1}, Lcom/example/forone/genericdemo/GenericFruits;->get()Ljava/lang/Object;    move-result-object v0    check-cast v0, Lcom/example/forone/genericdemo/Apple;    .line 28    .local v0, "apple":Lcom/example/forone/genericdemo/Apple;    return-void.end method

首先看到get()Ljava/lang/Object;此时返回的是Object类型,接下来check-cast v0, Lcom/example/forone/genericdemo/Apple;此时将Object类型转换为了Apple类型。

花非花 —— 重写非重写,而是重载


新建一个Banana类,继承GenericFruits<Banana>类,重写get()与set()方法

public class Banana extends GenericFruits<Banana> {    private static final String name = "Banana";    @Override    protected void set(Banana item) {        super.set(item);    }    @Override    protected Banana get() {        return super.get();    }}

根据上面的分析,GenericFruits<Banana>中的set()和get()方法的泛型类型会被擦除,变成set(Object)和Object get();然而在Java中普通重写方法时方法的形参是不能改变的,否则是编译器会提示报错,这一点应该是编译器针对泛型进行了特殊的处理,没有报编译错误。而上面的set(Banana item),参数从Object变成了Banana,set(Banana)与set(Object)实际上是重载,而我们用Override注解修饰时,我们是去实现重写的功能,那么虚拟机在运行时是怎么将重载变成重写的呢?在反编译的字节码中发现在泛型编译之后,引入了一个bridge的概念,先看代码

.class public Lcom/example/forone/genericdemo/Banana;.super Lcom/example/forone/genericdemo/GenericFruits;.source "Banana.java"# annotations.annotation system Ldalvik/annotation/Signature;    value = {        "Lcom/example/forone/genericdemo/GenericFruits",        "<",        "Lcom/example/forone/genericdemo/Banana;",        ">;"    }.end annotation# static fields.field private static final name:Ljava/lang/String; = "apple"# direct methods.method public constructor <init>()V    .locals 0    .prologue    .line 7    invoke-direct {p0}, Lcom/example/forone/genericdemo/GenericFruits;-><init>()V    return-void.end method# virtual methods.method protected get()Lcom/example/forone/genericdemo/Banana;    .locals 1    .prologue    .line 17    invoke-super {p0}, Lcom/example/forone/genericdemo/GenericFruits;->get()Ljava/lang/Object;    move-result-object v0    check-cast v0, Lcom/example/forone/genericdemo/Banana;    return-object v0.end method.method protected bridge synthetic get()Ljava/lang/Object;    .locals 1    .prologue    .line 7    invoke-virtual {p0}, Lcom/example/forone/genericdemo/Banana;->get()Lcom/example/forone/genericdemo/Banana;    move-result-object v0    return-object v0.end method.method protected set(Lcom/example/forone/genericdemo/Banana;)V    .locals 0    .param p1, "item"    # Lcom/example/forone/genericdemo/Banana;    .prologue    .line 12    invoke-super {p0, p1}, Lcom/example/forone/genericdemo/GenericFruits;->set(Ljava/lang/Object;)V    .line 13    return-void.end method.method protected bridge synthetic set(Ljava/lang/Object;)V    .locals 0    .prologue    .line 7    check-cast p1, Lcom/example/forone/genericdemo/Banana;    invoke-virtual {p0, p1}, Lcom/example/forone/genericdemo/Banana;->set(Lcom/example/forone/genericdemo/Banana;)V    return-void.end method

上面的代码太长,先看get()方法

# virtual methods.method protected get()Lcom/example/forone/genericdemo/Banana;    .locals 1    .prologue    .line 17    invoke-super {p0}, Lcom/example/forone/genericdemo/GenericFruits;->get()Ljava/lang/Object;//调用父类即泛型类的get()方法,返回object类型    move-result-object v0    //将Object强制转换为banana    check-cast v0, Lcom/example/forone/genericdemo/Banana;    return-object v0.end method.method protected bridge synthetic get()Ljava/lang/Object;    .locals 1    .prologue    .line 7    //调用Banana get()方法    invoke-virtual {p0}, Lcom/example/forone/genericdemo/Banana;->get()Lcom/example/forone/genericdemo/Banana;    move-result-object v0    return-object v0.end method

Banana类在调用Banane get()方法时,首先调用父类也就是泛型类的get()方法,返回Object类型,并强制转换为Banana,实现的是重载功能。而多出了一个用bridge修饰的Object get() ,其返回值是Object,内部调用了Banane get()。到这里可以发现,其实重写父类即泛型类的Object get()是编译之后自动生成的用bridge修饰的Object get()方法,而Banana get()为重载的方法,被bridge修饰的Object get()方法调用,从而起到了重写的作用。

再看看set(Banana)方法

.method protected set(Lcom/example/forone/genericdemo/Banana;)V    .locals 0    .param p1, "item"    # Lcom/example/forone/genericdemo/Banana;    .prologue    .line 12    invoke-super {p0, p1}, Lcom/example/forone/genericdemo/GenericFruits;->set(Ljava/lang/Object;)V    .line 13    return-void.end method.method protected bridge synthetic set(Ljava/lang/Object;)V    .locals 0    .prologue    .line 7    check-cast p1, Lcom/example/forone/genericdemo/Banana;    invoke-virtual {p0, p1}, Lcom/example/forone/genericdemo/Banana;->set(Lcom/example/forone/genericdemo/Banana;)V    return-void.end method

跟get(Banana)一样,set(Banana)也是被编译器自动生成的bridge set(Object)的方法调用,而bridge set(Object)才是真正重写父类即泛型类的set(Object)方法。而set(Banana)只是一个重载的方法。
从上面的分析可以得知,泛型子类的重写其实只是重载,通过编译器生成的用bridge修饰的方法来实现重写,而该函数再调用子类重写(实际是重载)的方法是模拟实现重写的功能。

总结


  1. 泛型是编译时泛型,用于检查类型安全以及类型推断,虚拟机运行时已经被擦除
  2. 泛型的类型参数T在编译后为Object类型,编译器自动生成代码对Object进行强制转换成类型参数T
  3. 泛型子类的重写其实只是重载,通过编译器生成的用bridge修饰的方法来实现重写,而该函数再调用子类重写(实际是重载)的方法是模拟实现重写的功能。
原创粉丝点击