在Hibernate应用中实现批量操作

来源:互联网 发布:ck 知乎 编辑:程序博客网 时间:2024/06/15 00:11

在Hibernate应用中实现批量操作
最近的一个项目中,作一个查询的时候需求批量更新一下数据,然后在查询。
在Hiberante应用中,这个更新操作

一、session.update(object)
一个方法是,根据条件加载出一个list,如果符合条件的有上万或更多,会加载这么多个对象到sessin缓存中
然后遍历,对每个对象挨个更新。当事务提交是会清理缓存,同时执行上万个update语句

代码
  1. tx = session.beginTransaction();   
  2. Iterator objects =session.find("from Project where p.id>0").iterator();   
  3. while(objects .hasNext()){   
  4. Object object=(Object)objects .next();   
  5. object.setXXX();   
  6. }    
  7. tx.commit();   
  8. session.close();  

以上批量更新方式有两个缺点:
(1) 占用大量内存,必须把所有符合条件的对象先加载到内存,然后一一更新它们。
(2) 执行的update语句的数目太多,每个update语句只能更新一个Customer对象,频繁的访问数据库,会降低应用的性能。
为了迅速释放对象占用的内存,可以在更新每个对象后,就调用Session的evict()方法立即释放它的内存:
代码
  1. tx = session.beginTransaction();   
  2. Iterator objects=session.find(“hql").iterator();   
  3. while(objects.hasNext()){   
  4. Object  object =(Object) objects.next();   
  5. object.setXXX();   
  6. session.flush();   
  7. session.evict(customer);   
  8. }    
  9. tx.commit();   
  10. session.close();  

flush()方法使Hibernate立刻根据这个object对象的状态变化同步更新数据库,从而立即执行相关的update语句;evict()方法用于把这个object对象从缓存中清除出去,从而及时释放它占用的内存。
可以稍微提高一些性能,但还是要产生上万个update语句,这个影响批量操作的重要因素。

 

二、直接执行sql
如果hibernate能执行执行一个update语句,那么符合条件的对象将一次性更新好。
但是Hibernate并没有直接提供执行这种update语句的接口。应用程序必须绕过Hibernate API,直接通过JDBC API来执行该SQL语句:

代码
  1. tx = session.beginTransaction();   
  2. Connection con=session.connection();   
  3. PreparedStatement stmt=con.prepareStatement(sql");   
  4. stmt.executeUpdate();   
  5. tx.commit();   

以上程序演示了绕过Hibernate API,直接通过JDBC API访问数据库的过程。应用程序通过Session的connection()方法获得该Session使用的数据库连接,然后通过它创建PreparedStatement对象并执行SQL语句。值得注意的是,应用程序仍然通过Hibernate的Transaction接口来声明事务边界。

 

三、使用存储过程
如果底层数据库(如Oracle)支持存储过程,也可以通过存储过程来执行批量更新。存储过程直接在数据库中运行,速度更加快。

代码
  1. create or replace procedure updateProject is   
  2. begin   
  3.   update project p set p.total_intend_gather =    
  4.   (select sum(ig.gather_sum) from intend_gather ig where ig.project_number=p.project_number);   
  5.      
  6.   update project p set p.total_actual_gather =    
  7.   (select sum(ag.gahter_sum) from actual_gather ag where ag.project_number=p.project_number);   
  8.      
  9.   update project p set p.total_invoice=   
  10. (select sum(invoice.invoice_sum) from invoice invoice   
  11.  where invoice.intend_id in   
  12.  (select ig.intend_id  from intend_gather ig where ig.project_number=p.project_number));   
  13.     
  14. end updateProject;   

 

调用代码

代码
  1. Session session = this.getSession();   
  2. Transaction tx =null;   
  3. try {   
  4.     tx = session.beginTransaction();   
  5.     Connection con = session.connection();   
  6.     String procedure = "{call updateproject() }";   
  7.     CallableStatement cstmt = con.prepareCall(procedure);   
  8.     cstmt.executeUpdate();   
  9.     tx.commit();   
  10.   
  11. catch (Exception e) {   
  12.    tx.rollback();   
  13. }   

 

上面程序看出,应用程序也必须绕过Hibernate API,直接通过JDBC API来调用存储过程。

四、delete操作
Session的各种重载形式的update()方法都一次只能更新一个对象,而delete()方法的有些重载形式允许以HQL语句作为参数,例如:

代码
  1. session.delete(from Project where p.id>0);  

能够实现批量删除,但是令人失望的是Session的delete()方法并没有执行以下delete语句
代码
  1. delete from PROJECT where ID>0;  

而是
Session的delete()方法先通过以下select语句把所有符合的对象加载到内存中:
代码
  1. select * from Project where ID>0;  

接下来执行N多个delete语句,逐个删除project对象:
代码
  1. delete from PROJECT where ID=i;   
  2. delete from PROJECT where ID=j;   
  3. delete from PROJECT where ID=k;  

 

所以,直接通过Hibernate API进行批量更新和批量删除都不爽。而直接通过JDBC API执行相关的SQL语句或调用相关的存储过程,是批量更新和批量删除的最佳方式,这两种方式都有以下优点:
(1) 无需把数据库中的大批量数据先加载到内存中,然后逐个更新或修改它们,因此不会消耗大量内存。
(2) 能在一条SQL语句中更新或删除大批量的数据。 

原创粉丝点击