Hibernate懒加载策略

来源:互联网 发布:nginx 浏览器缓存设置 编辑:程序博客网 时间:2024/04/27 23:07

所谓懒加载(lazy)就是延时加载,就是当在真正需要数据的时候,才真正执行数据加载操作

至于为什么要用懒加载呢,就是当我们要访问的数据量过大时,明显用缓存不太合适,因为内存容量有限 ,为了减少并发量,减少系统资源的消耗,我们让数据在需要的时候才进行加载,这时我们就用到了懒加载。

在通过JDBC操作数据时,我们只能通过SQL语句来加载我们所需要的数据,但是到了Hibernate世界中(确切的说,是到了对象关系映射的世界中),由于有O-R Mapping的帮助,我们拥有了更多的自由以及更多的方法,Hibernate总共有4种数据加载方式,分别是:即时加载,延迟加载,预先加载,批量加载,接下来我们分别讨论这四种加载方式,以及它们的使用方法。
1、 即时加载:
 即时加载是指,当实体加载完成后,立即加载该实体所关联的数据。我们以前面讨论一对多关联映射的例子为例:客户和客户订购的货物是一对多的关系,所以我们在配置客户实体类的集合时采用了下面的配置:(lazy有三个值,true,false,proxy,默认的是lazy="proxy")
<set name=”orders” table=”order” inverse=”true” cascade=”none” sort=”true” lazy=”false”> <key column=”c_id”/><one-to-many class=”com.neusoft.entity.Order”/></set>

我们注意,在set元素的lazy属性被设置为false,此时就启动了即时加载,看下面的代码:
String hql=”from Customer c where c.name=’zx’ ”;List list=session.createQuery(hql).list();System.out.println(“query finish….../n”);Iterator it=list.iterator();While(it.hasNext()){ Customer customer=(Customer)it.next(); Set set=customer.getOrders();}

当我们运行上面的代码时,会生成如下类似的输出:

Select * from customer where name=’zx’;
Select * from order where id=’1’;
query finish…...

我们看到当执行查询Customer实体操作时,会自动加载它所关联的Order实体对象,因此会出现第二条查询语句,这就是即时加载的基本原理,当宿主实体加载时,会立即自动加载关联的实体对象,并完成关联实体对象的属性填充和实体对象的构造。但有一个问题就是,不管我们是否使用加载后的实体都需要进行加载。
 
2、延迟加载:
 在即时加载中,当加载Customer对象时,通过另一条查询语句自动加载了它所关联的实体对象,但是如果我们只需要Customer对象数据,而不需要它所关联的Order对象的数据,此时就造成了性能的无谓损耗。延迟加载机制的引入,使这个问题得到了化解。还以上面的例子为例,当我们想起用延迟加载机制时,我们要进行如下的配置:
<set name=”orders” table=”order” inverse=”true” cascade=”none” sort=”true” lazy=”true”> <key column=”c_id”/><one-to-many class=”com.neusoft.entity.Order”/></set> 

在set元素的lazy属性设置成true,此时就启动了延迟加载,当我们再次运行上面的代码时,会生成如下的输出:
 
Select * from customer where name=’zx’;
query finish…...
Select * from order where id=’1’;
 
注意与即时加载不同,当我们执行查询Customer对象时,并没有立即加载它所关联的Order对象,只有执行确实获取关联的Order对象数据时,才会发起对关联对象的查询,这就是所谓的延迟加载机制,只有当确实需要获取关联数据时,才去真正加载关联对象。有关延迟加载的高级应用请查阅《深入理解Hibernate延时加载机制》。
 
3、预先加载:
 要启用预先加载,必须如下配置:
<set name=”orders” table=”order” inverse=”true” cascade=”none” sort=”true” out-join=”auto”> <key column=”c_id”/><one-to-many class=”com.neusoft.entity.Order”/></set>

如我们所见,将out-join设置为true,这时就启用了预先加载,预先加载与即时加载不同,它是通过外连接来加载关联实体的,而不是通过两条查询语句来加载关联实体,如上配置当我们再次执行上面的代码时,会生成如下的输出:
 
Select * from customer c left outer join order o on c.id=o.id and c.name=’zx’;
 
4、 批量加载:
所谓批量加载,就是通过批量提交多个限定条件,一次完成多个数据的读取。比如我们有如下的SQL语句:
 
Select * from customer where id=’1’;
Select * from customer where id=’2’;
 
我们可以将以上两个SQL语句合并成如下形式:
 
Select * from customer where id=’1’ or id=’2’;
 
这就是批量加载的原理,当使用批量加载时,Hibernate会自动在当前session中查找是否还有同类型的待加载的实体对象,如果有就将查询条件合并到当前的查询语句中,这样就通过一次数据库操作完成了多次读取任务,从而提高了读取性能。如果想启用批量加载,必须如下配置实体类的class元素:
 
<class name=”customer” table=”customer” batch-size=”5”>
 
通过指定batch-size属性的值,来指定批量加载尺寸以及启用批量加载,以上配置每次最多同时加载5个同类型实体对象。一般来说,batch-size应该设置成一个合理的小的整数值。(一般设置成<10)。

5、 在使用SSH框架的时候,我们的hibernate由Spring接管,Spring提供给我们的解决方法是使用opensessioninview来处理,
过程在web.xml文件中配置一个过滤器用于解决问题
<!-- 配置opensessioninview解决懒加载,本质一个过滤器. --><filter>        <filter-name>OpenSessionInViewFilter</filter-name>        <filter-class>org.springframework.orm.hibernate3.support.OpenSessionInViewFilter</filter-class></filter><filter-mapping>        <filter-name>OpenSessionInViewFilter</filter-name>        <url-pattern>/*</url-pattern></filter-mapping>
该方法可以有效的减少对数据库的查询,缺地那是和数据库保持的session时间延长了。

而对于不同的方式下边有三种概括:

A、 实体对象的延迟加载

如果想对实体对象使用延迟加载,必须要在实体的映射配置文件中进行相应的配置,如下所示:
<hibernate-mapping>
<class name="com.fendou.domain.User" table="T_user" lazy="true">

 <id name="id" type="java.lang.Integer" column="s_id">

 <generator class="sequence">

 <param name="sequence">U_ID</param>

 </generator>

 </id>

<property name="name" column="s_name"></property>

<property name="pass" column="s_pass"></property>

 

 </class>
</hibernate-mapping>
     通过将class的lazy属性设置为true,来开启实体的延迟加载特性。如果我们运行下面的代码:
    User user=(User)session.load(User.class,”1”);
    System.out.println(user.getName());

观察此时user对象的内存快照,会惊奇的发现,此时返回的可能是User$EnhancerByCGLIB$$bede8986类型的对象,而且其属性为null,这是怎么回事?session.load()方法会返回实体对象的代理类对象,这里所返回的对象类型就是User对象的代理类对象。在Hibernate中通过使用 CGLIB,来实现动态构造一个目标对象的代理类对象,并且在代理类对象中包含目标对象的所有属性和方法,而且所有属性均被赋值为null。通过调试器显示的内存快照,可以看出此时真正的User对象,是包含在代理对象的CGLIB$CALBACK_0.target属性中,当代码运行到(2)处时,此时调用user.getName()方法,这时通过CGLIB赋予的回调机制,实际上调用CGLIB$CALBACK_0.getName()方法,当调用该方法时,Hibernate会首先检查CGLIB$CALBACK_0.target属性是否为null,如果不为空,则调用目标对象的getName 方法,如果为空,则会发起数据库查询,生成类似这样的SQL语句:select * from user where id=’1’;来查询数据,并构造目标对象,并且将它赋值到CGLIB$CALBACK_0.target属性中。
  这样,通过一个中间代理对象,Hibernate实现了实体的延迟加载,只有当用户真正发起获得实体对象属性的动作时,才真正会发起数据库查询操作。所以实体的延迟加载是用通过中间代理类完成的,所以只有session.load()方法才会利用实体延迟加载,因为只有session.load()方法才会返回实体类的代理类对象。

B、集合类型的延迟加载
  在Hibernate的延迟加载机制中,针对集合类型的应用,意义是最为重大的,因为这有可能使性能得到大幅度的提高,为此Hibernate进行了大量的努力,其中包括对JDK Collection的独立实现,在一对多关联中,定义的用来容纳关联对象的Set集合,并不是java.util.Set类型或其子类型,而是 net.sf.hibernate.collection.Set类型,通过使用自定义集合类的实现,Hibernate实现了集合类型的延迟加载。为了对集合类型使用延迟加载,必须如下配置实体类的关于关联的部分:
<hibernate-mapping>
   <class name=”com.neusoft.entity.User” table=”user”>
     ……
    <set name=”addresses” table=”address” lazy=”true” inverse=”true”>
     <key column=”user_id”/>
      <one-to-many class=”com.neusoft.entity.Arrderss”/>
    </set>
   </class>
</hibernate-mapping>
   通过将<set>元素的lazy属性设置为true来开启集合类型的延迟加载特性。看下面的代码:
 User user=(User)session.load(User.class,”1”);
 Collection addset=user.getAddresses();      (1)
 Iterator it=addset.iterator();               (2)
 while(it.hasNext()) {
  Address address=(Address)it.next();
  System.out.println(address.getAddress());
 }
     当程序执行到(1)处时,并不会发起对关联数据的查询来加载关联数据,只有运行到(2)处时,真正的数据读取操作才会开始,这时Hibernate会根据缓存中符合条件的数据索引,来查找符合条件的实体对象。
     这里引入了一个全新的概念——数据索引,下面首先将说明什么是数据索引。在Hibernate中对集合类型进行缓存时,是分两部分进行缓存的,首先缓存集合中所有实体的id列表,然后缓存实体对象,这些实体对象的id列表,就是所谓的数据索引。当查找数据索引时,如果没有找到对应的数据索引,这时就会一条select SQL的执行,获得符合条件的数据,并构造实体对象集合和数据索引,然后返回实体对象的集合,并且将实体对象和数据索引纳入Hibernate的缓存之中。另一方面,如果找到对应的数据索引,则从数据索引中取出id列表,然后根据id在缓存中查找对应的实体,如果找到就从缓存中返回,如果没有找到,在发起select SQL查询。在这里我们看出了另外一个问题,这个问题可能会对性能产生影响,这就是集合类型的缓存策略。如果如下配置集合类型:
<hibernate-mapping>
   <class name=”com.neusoft.entity.User” table=”user”>
    …
    <set name=”addresses” table=”address” lazy=”true” inverse=”true”>
      <cache usage=”read-only”/>
      <key column=”user_id”/>
      <one-to-many class=”com.neusoft.entity.Arrderss”/>
    </set>
   </class>
</hibernate-mapping>
     这里应用了<cache usage=”read-only”/>配置,如果采用这种策略来配置集合类型,Hibernate将只会对数据索引进行缓存,而不会对集合中的实体对象进行缓存。如上配置运行下面的代码:
 User user=(User)session.load(User.class,”1”);
 Collection addset=user.getAddresses();      
 Iterator it=addset.iterator();               
 while(it.hasNext()) {
  Address address=(Address)it.next();
  System.out.println(address.getAddress());
 }
 System.out.println(“Second query……”);
 User user2=(User)session.load(User.class,”1”);
 Collection it2=user2.getAddresses();
 while(it2.hasNext()) {
  Address address2=(Address)it2.next();
  System.out.println(address2.getAddress());
 }

  运行这段代码,会得到类似下面的输出:
   Select * from user where id=’1’;
   Select * from address where user_id=’1’;
   Tianjin
   Dalian
   Second query……
   Select * from address where id=’1’;
   Select * from address where id=’2’;
   Tianjin
   Dalian    
  可以看到,当第二次执行查询时,执行了两条对address表的查询操作,为什么会这样呢?这是因为当第一次加载实体后,根据集合类型缓存策略的配置,只对集合数据索引进行了缓存,而并没有对集合中的实体对象进行缓存,所以在第二次再次加载实体时,Hibernate找到了对应实体的数据索引,但是根据数据索引,却无法在缓存中找到对应的实体,所以Hibernate根据找到的数据索引发起了两条select SQL的查询操作,这里造成了对性能的浪费,怎样才能避免这种情况呢?必须对集合类型中的实体也指定缓存策略,对集合类型进行配置:
<hibernate-mapping>
   <class name=”com.neusoft.entity.User” table=”user”>
    ……
     <set name=”addresses” table=”address” lazy=”true” inverse=”true”>
       <cache usage=”read-write”/>
       <key column=”user_id”/>
       <one-to-many class=”com.neusoft.entity.Arrderss”/>
     </set>
   </class>
</hibernate-mapping>
  此时Hibernate会对集合类型中的实体也进行缓存,再次运行上面的代码,将会得到类似如下的输出: 
   Select * from user where id=’1’;
   Select * from address where user_id=’1’;
   Tianjin
   Dalian
   Second query……
   Tianjin
   Dalian 
  这时将不会再有根据数据索引进行查询的SQL语句,因为此时可以直接从缓存中获得集合类型中存放的实体对象。
C、属性延迟加载
     在Hibernate3中,引入了一种新的特性——属性的延迟加载,这个机制又为获取高性能查询提供了有力的工具。在大数据对象读取时,假设在User 对象中有一个resume字段,该字段是一个java.sql.Clob类型,包含了用户的简历信息,当加载该对象时,不得不每一次都要加载这个字段,而不论是否真的需要它,而且这种大数据对象的读取本身会带来很大的性能开销。在Hibernate2中,只有通过面向性能的粒度细分,来分解User类,来解决这个问题,但是在Hibernate3中,可以通过属性延迟加载机制,来使我们获得只有当我们真正需要操作这个字段时,才去读取这个字段数据的能力,为此必须如下配置实体类:
 <hibernate-mapping>
  <class name=”com.neusoft.entity.User” table=”user”>
      ……
     <property name=”resume” type=”java.sql.Clob” column=”resume” lazy=”true”/>
  </class>
 </hibernate-mapping>
     通过对<property>元素的lazy属性设置true来开启属性的延迟加载,在Hibernate3中为了实现属性的延迟加载,使用了类增强器来对实体类的Class文件进行强化处理,通过增强器的增强,将CGLIB的回调机制逻辑,加入实体类,这里我们可以看出属性的延迟加载,还是通过CGLIB来实现的。CGLIB是Apache的一个开源工程,这个类库可以操纵java类的字节码,根据字节码来动态构造符合要求的类对象。根据上面的配置我们运行下面的代码:
 String sql=”from User user where user.name=’zx’ ”;
 Query query=session.createQuery(sql);   (1)
 List list=query.list();
 for(int i=0;i<list.size();i++) {
  User user=(User)list.get(i);
  System.out.println(user.getName());
  System.out.println(user.getResume());   (2)
 }
  当执行到(1)处时,会生成类似如下的SQL语句:
 Select id,age,name from user where name=’zx’;
  这时Hibernate会检索User实体中所有非延迟加载属性对应的字段数据,当执行到(2)处时,会生成类似如下的SQL语句:
 Select resume from user where id=’1’;
这时会发起对resume字段数据真正的读取操作。

 



2 0