hibernate懒加载中的一些猫腻

来源：互联网发布：淘宝青少年男装编辑：程序博客网时间：2024/05/22 00:50

什么是懒加载？

所谓懒加载(lazy)就是延时加载，延迟加载。

什么时候用懒加载呢，我只能回答要用懒加载的时候就用懒加载。

至于为什么要用懒加载呢，就是当我们要访问的数据量过大时，明显用缓存不太合适，

因为内存容量有限，为了减少并发量，减少系统资源的消耗，

我们让数据在需要的时候才进行加载，这时我们就用到了懒加载。

比如部门ENTITY和员工ENTITY,部门与员工1对多，如果lazy设置为 false，那么只要加载了一个部门的po,就会根据一对多配置的关系把所有员工的po也加载出来。但是实际上有时候只是需要用到部门的信息，不需要用到员工的信息，这时员工po的加载就等于浪费资源。如果lazy设置为true,那么只有当你访问部门po的员工信息时候才回去加载员工的po的信息。

Hibernate懒加载

在Hibernate中，查询方法有两个，分别是get()和load()，这两种方法的不同就是load()拥有懒加载的特性。Load()方法就是在查询某一条数据的时候并不会直接将这条数据以指定对象的形式来返回，而是在你真正需要使用该对象里面的一些属性的时候才会去数据库访问并得到数据。

原理及其遇到的问题

当使用session中的load方法查询数据库中的记录时，我们返回的是一个代理对象，而不是真正需要的那个对象；例如数据库中存有个Student表，我们有cn.binyulan.doman.Student的领域对象，如果查询Id值为“200626313”的Student stu = (Student)session.load(Student.class,"200626313")，然后我们打印System.out.println(stu.getClass);得到的结果为cn.binyulan.domain.Student$$EnhancerByCGLIB$$5a7cc325,名字很奇怪吧，这个对象是Hibernate帮我们生成的，从名字可以看出它是对Student类的增强类的对象，其实这就是个代理对象，这个对象里并没有我们需要的Student的数据，所以如果你在session关闭后在使用stu来获取信息，如stu.getName();就会出现如下异常：org.hibernate.LazyInitializationException: could not initialize proxy - no Session，这就说明了stu中没有我们需要的数据了。

stu对象现在到底是什么呢，它其实是一个代理类，这个类具有查询数据库的能力，当session没有关闭的时候如果我们调用stu.getName()方法;那么这个类会去查询数据库并返回相应的数据。之后我们关闭session之后再去使用这个类就不会有异常了，可是我们如果调用stu.getName()只是为了让代理类去查数据库，如果别人看我们的代码时候觉得这两句在逻辑上根本就没有用，别人就很容易注释掉，一注释掉就又会出现异常了，所以hibernate提供了一个方法Hibernate.initialize(stu);这样就可以初始化这个代理对象了。

不知道大家注意到没有，上面的那句代码Student stu = (Student)session.load(Student.class,"200626313")把stu强制转化为Student类型，有人会问：不是返回的是代理对象么，那怎么又强制转换成Student了呢，其实代理类是Student的子类，它具有了比父类更强的能力（数据库查询），这个类是怎么生成的呢？其实hibernate使用了asm.jar和cglig-2.1.3.jar，在内存中修改Student类的字节码，修改后的字节码只要符合class文件的规则，就可以创建出代理对象。

Domain对象不应该final的，大家现在应该明白为什么了吧，如果是final的，那么就不可以继承，当然也就不可以产生代理对象，也就不能实现懒加载了，如果你不用懒加载，那么把domain对象设计成fianl的也是可以的。

懒加载的几种表现形式？

A、实体对象的延迟加载
如果想对实体对象使用延迟加载，必须要在实体的映射配置文件中进行相应的配置，如下所示：
<hibernate-mapping>
　<class name=”com.neusoft.entity.User” table=”user” lazy=”true”>
   　……
　</class>
</hibernate-mapping>
    　通过将class的lazy属性设置为true，来开启实体的延迟加载特性。如果我们运行下面的代码：
　　　User user=(User)session.load(User.class,”1”);（1）
　　　System.out.println(user.getName());（2）
　　当运行到(1)处时，Hibernate并没有发起对数据的查询，如果此时通过一些调试工具，观察此时user对象的内存快照，会惊奇的发现，此时返回的可能是User$EnhancerByCGLIB$$bede8986类型的对象，而且其属性为null,这是怎么回事？session.load()方法会返回实体对象的代理类对象，这里所返回的对象类型就是User对象的代理类对象。在Hibernate中通过使用 CGLIB,来实现动态构造一个目标对象的代理类对象，并且在代理类对象中包含目标对象的所有属性和方法，而且所有属性均被赋值为null。通过调试器显示的内存快照，可以看出此时真正的User对象，是包含在代理对象的CGLIB$CALBACK_0.target属性中，当代码运行到（2）处时，此时调用user.getName()方法，这时通过CGLIB赋予的回调机制，实际上调用CGLIB$CALBACK_0.getName()方法，当调用该方法时，Hibernate会首先检查CGLIB$CALBACK_0.target属性是否为null，如果不为空，则调用目标对象的getName 方法，如果为空，则会发起数据库查询，生成类似这样的SQL语句：select * from user where id=’1’;来查询数据，并构造目标对象，并且将它赋值到CGLIB$CALBACK_0.target属性中。
　　这样，通过一个中间代理对象，Hibernate实现了实体的延迟加载，只有当用户真正发起获得实体对象属性的动作时，才真正会发起数据库查询操作。所以实体的延迟加载是用通过中间代理类完成的，所以只有session.load()方法才会利用实体延迟加载，因为只有session.load()方法才会返回实体类的代理类对象。
B、集合类型的延迟加载
　　在Hibernate的延迟加载机制中，针对集合类型的应用，意义是最为重大的，因为这有可能使性能得到大幅度的提高，为此Hibernate进行了大量的努力，其中包括对JDK Collection的独立实现，在一对多关联中，定义的用来容纳关联对象的Set集合，并不是java.util.Set类型或其子类型，而是 net.sf.hibernate.collection.Set类型，通过使用自定义集合类的实现，Hibernate实现了集合类型的延迟加载。为了对集合类型使用延迟加载，必须如下配置实体类的关于关联的部分：
<hibernate-mapping>
   <class name=”com.neusoft.entity.User” table=”user”>
     ……
    <set name=”addresses” table=”address” lazy=”true” inverse=”true”>
     <key column=”user_id”/>
      <one-to-many class=”com.neusoft.entity.Arrderss”/>
    </set>
   </class>
</hibernate-mapping>
   通过将<set>元素的lazy属性设置为true来开启集合类型的延迟加载特性。看下面的代码：
　User user=(User)session.load(User.class,”1”);
　Collection addset=user.getAddresses();      (1)
　Iterator it=addset.iterator();               (2)
　while(it.hasNext())　{
　　Address address=(Address)it.next();
　　System.out.println(address.getAddress());
　}
    　当程序执行到(1)处时，并不会发起对关联数据的查询来加载关联数据，只有运行到(2)处时，真正的数据读取操作才会开始，这时Hibernate会根据缓存中符合条件的数据索引，来查找符合条件的实体对象。
    　这里引入了一个全新的概念——数据索引，下面首先将说明什么是数据索引。在Hibernate中对集合类型进行缓存时，是分两部分进行缓存的，首先缓存集合中所有实体的id列表，然后缓存实体对象，这些实体对象的id列表，就是所谓的数据索引。当查找数据索引时，如果没有找到对应的数据索引，这时就会一条select SQL的执行，获得符合条件的数据，并构造实体对象集合和数据索引，然后返回实体对象的集合，并且将实体对象和数据索引纳入Hibernate的缓存之中。另一方面，如果找到对应的数据索引，则从数据索引中取出id列表，然后根据id在缓存中查找对应的实体，如果找到就从缓存中返回，如果没有找到，在发起select SQL查询。在这里我们看出了另外一个问题，这个问题可能会对性能产生影响，这就是集合类型的缓存策略。如果如下配置集合类型：
<hibernate-mapping>
   <class name=”com.neusoft.entity.User” table=”user”>
    …
    <set name=”addresses” table=”address” lazy=”true” inverse=”true”>
     　<cache usage=”read-only”/>
     　<key column=”user_id”/>
     　<one-to-many class=”com.neusoft.entity.Arrderss”/>
    </set>
   </class>
</hibernate-mapping>
    　这里应用了<cache usage=”read-only”/>配置，如果采用这种策略来配置集合类型，Hibernate将只会对数据索引进行缓存，而不会对集合中的实体对象进行缓存。如上配置运行下面的代码：
　User user=(User)session.load(User.class,”1”);
　Collection addset=user.getAddresses();
　Iterator it=addset.iterator();
　while(it.hasNext())　{
　　Address address=(Address)it.next();
　　System.out.println(address.getAddress());
　}
　System.out.println(“Second query……”);
　User user2=(User)session.load(User.class,”1”);
　Collection it2=user2.getAddresses();
　while(it2.hasNext())　{
　　Address address2=(Address)it2.next();
　　System.out.println(address2.getAddress());
　}

　　运行这段代码，会得到类似下面的输出：
　　　Select * from user where id=’1’;
　　　Select * from address where user_id=’1’;
　　　Tianjin
　　　Dalian
　　　Second query……
　　　Select * from address where id=’1’;
　　　Select * from address where id=’2’;
　　　Tianjin
　　　Dalian
　　可以看到，当第二次执行查询时，执行了两条对address表的查询操作，为什么会这样呢？这是因为当第一次加载实体后，根据集合类型缓存策略的配置，只对集合数据索引进行了缓存，而并没有对集合中的实体对象进行缓存，所以在第二次再次加载实体时，Hibernate找到了对应实体的数据索引，但是根据数据索引，却无法在缓存中找到对应的实体，所以Hibernate根据找到的数据索引发起了两条select SQL的查询操作，这里造成了对性能的浪费，怎样才能避免这种情况呢？必须对集合类型中的实体也指定缓存策略，对集合类型进行配置：
<hibernate-mapping>
   <class name=”com.neusoft.entity.User” table=”user”>
    ……
    　<set name=”addresses” table=”address” lazy=”true” inverse=”true”>
     　　<cache usage=”read-write”/>
     　　<key column=”user_id”/>
     　　<one-to-many class=”com.neusoft.entity.Arrderss”/>
    　</set>
   </class>
</hibernate-mapping>
　　此时Hibernate会对集合类型中的实体也进行缓存，再次运行上面的代码，将会得到类似如下的输出：
　　　Select * from user where id=’1’;
　　　Select * from address where user_id=’1’;
　　　Tianjin
　　　Dalian
　　　Second query……
　　　Tianjin
　　　Dalian
　　这时将不会再有根据数据索引进行查询的SQL语句，因为此时可以直接从缓存中获得集合类型中存放的实体对象。
C、属性延迟加载
    　在Hibernate3中，引入了一种新的特性——属性的延迟加载，这个机制又为获取高性能查询提供了有力的工具。在大数据对象读取时，假设在User 对象中有一个resume字段，该字段是一个java.sql.Clob类型，包含了用户的简历信息，当加载该对象时，不得不每一次都要加载这个字段，而不论是否真的需要它，而且这种大数据对象的读取本身会带来很大的性能开销。在Hibernate2中，只有通过面向性能的粒度细分，来分解User类，来解决这个问题，但是在Hibernate3中，可以通过属性延迟加载机制，来使我们获得只有当我们真正需要操作这个字段时，才去读取这个字段数据的能力，为此必须如下配置实体类：
　<hibernate-mapping>
　　<class name=”com.neusoft.entity.User” table=”user”>
   　　 ……
   　　<property name=”resume” type=”java.sql.Clob” column=”resume” lazy=”true”/>
　　</class>
　</hibernate-mapping>
    　通过对<property>元素的lazy属性设置true来开启属性的延迟加载，在Hibernate3中为了实现属性的延迟加载，使用了类增强器来对实体类的Class文件进行强化处理，通过增强器的增强，将CGLIB的回调机制逻辑，加入实体类，这里我们可以看出属性的延迟加载，还是通过CGLIB来实现的。CGLIB是Apache的一个开源工程，这个类库可以操纵java类的字节码，根据字节码来动态构造符合要求的类对象。根据上面的配置我们运行下面的代码：
　String sql=”from User user where user.name=’zx’ ”;
　Query query=session.createQuery(sql);   (1)
　List list=query.list();
　for(int i=0;i<list.size();i++)　{
　　User user=(User)list.get(i);
　　System.out.println(user.getName());
　　System.out.println(user.getResume());   (2)
　}
　　当执行到(1)处时，会生成类似如下的SQL语句：
　Select id,age,name from user where name=’zx’;
　　这时Hibernate会检索User实体中所有非延迟加载属性对应的字段数据，当执行到(2)处时，会生成类似如下的SQL语句：
　Select resume from user where id=’1’;
这时会发起对resume字段数据真正的读取操作。

1 0