Hibernate的优化

来源:互联网 发布:视频批量合成软件 编辑:程序博客网 时间:2024/05/17 08:09

优化总结

要想优化Hibernate,我们必须知道应该从什么地方进行优化,从什么地方入手。Hibernate的优化方向:

  •  数据库设计调整
  • HQL优化
  • API的正确使用(如根据不同的业务类型选用不同的集合及查询API)
  • 主配置参数(日志,查询缓存,fetch_size, batch_size等)
  •  映射文件优化(ID生成策略,二级缓存,延迟加载,关联优化)
  •   一级缓存的管理
  •   针对二级缓存,还有许多特有的策略
  •   事务控制策略。


 

具体分析

第一点:数据库设计调整

前边博客介绍过数据库设计,今天我们还从这开始,表的设计就是建楼的基础,如何让基础简洁而结实这是最重要的。

优化策略:

1.建索引

2.减少表之间的关联

3.简化查询字段,没用的字段不要,已经对返回结果的控制,尽量返回少量数据

4.适当的冗余数据,不过分最求高范式

5.尽量不使用联合主键

6. ID的生成机制,不同的数据库所提供的机制并不完全一样


第二点:HQL优化


(HQL知识图)

假如想好好了解一下的建议看一下这篇博客HQL详细使用,我个人认为写的还可以,知识总结的很细致。

总结:

1.实体查询:可以使用sql语句查询

2.实体的更新和删除:hibernate3中直接提供更加灵活更加效率的解决方法

3.属性查询:动态构造实例对象,对结果集进行封装

4.分组与排序:

A.Order by子句

B.Group by子句与统计查询

C.优化统计查询:内连接,外连接

5.参数绑定:和jdbc一样,对hibernate的参数绑定提供了丰富的支持。

第三点:主配置

 a) 查询缓存,同下面讲的缓存不太一样,它是针对HQL语句的缓存,即完全一样的语句再次执行时可以利用缓存数据。但是,查询缓存在一个交易系统(数据变更频繁,查询条件相同的机率并不大)中可能会起反作用:它会白白耗费大量的系统资源但却难以派上用场。

  b) fetch_size,同JDBC的相关参数作用类似,参数并不是越大越好,而应根据业务特征去设置

  c) batch_size同上。

  d) 生产系统中,切记要关掉SQL语句打印。


第三点:缓存

运行机制:

介于应用程序和物理数据源之间,其作用是为了降低应用程序对物理数据源访问的频数,从而提高运行性能。

缓存被广泛应用的用于优化数据库。当一些数据被从数据库中读取出来的时候,我们可以把它们放到缓存里。这样我们可以再次使用的时候直接从缓存中取出来,这样我们的效率就提高了很多。

控制范围:

一级缓存是session对象的生命周期通常对应的一个数据库事务或者一个应用事务,它是事务范围内的缓存

二级缓存是一个可插拔的缓存插件,它是由SessionFactory负责管理。由于SessionFactory对象的生命周期和应用程序的整个过程对应,所以二级缓存是进城范围或者集群范围内的缓存。用于初始化很少更改的数据、不重要的数据,不会并发访问的数据。

 

Hibernate缓存的一些问题和建议:hibernate的缓存

第四点:捉取策略

1. 捉取优化:Hibernate在关联关系之间进行导航,充分利用Hibernate提供的技术

2. 如何捉取

立即捉取:当捉取宿主对象时,同时捉取其相关对象和关联集以及属性

延迟加载:当捉宿主对象时,并不捉取其关联对象,而是当对其对象进行调用时才加载。

3. 捉取粒度:设置捉取个数


a) 实体延迟加载:通过使用动态代理实现

b) 集合延迟加载:通过实现自有的SET/LIST,HIBERNATE提供了这方面的支持

c) 属性延迟加载:


第五点:批量数据处理(修改和删除)

即使是使用JDBC,在进行大批数据更新时,BATCH与不使用BATCH有效率上也有很大的差别。我们可以通过设置batch_size来让其支持批量操作。

  举个例子,要批量删除某表中的对象,如“delete Account”,打出来的语句,会发现HIBERNATE找出了所有ACCOUNT的ID,再进行删除,这主要是为了维护二级缓存,这样效率肯定高不了,在后续的版本中增加了bulk delete/update,但这也无法解决缓存的维护问题。也就是说,由于有了二级缓存的维护问题,HIBERNATE的批量操作效率并不尽如人意!


在Hibernate2中,如果需要对任何数据进行修改和删除操作都需要先执行查询操作,在得到数据后才进行修改和删除。

1. 不适用Hibernate API而是直接使用JDBC API来做原生态SQL语句进行查询,这种方法比较好,相对来说较快。

2. 运用存储过程

3. 一定量范围内可以使用hibernate API,但是特大数据量不行。

第六点:事务控制:

事务方面对性能有影响的主要包括:事务方式的选用,事务隔离级别以及锁的选用

   a) 事务方式选用:如果不涉及多个事务管理器事务的话,不需要使用JTA,只有JDBC的事务控制就可以。

   b) 事务隔离级别:参见标准的SQL事务隔离级别

   c) 锁的选用:悲观锁(一般由具体的事务管理器实现),对于长事务效率低,但安全。乐观锁(一般在应用级别实现),如在HIBERNATE中可以定义VERSION字段,显然,如果有多个应用操作数据,且这些应用不是用同一种乐观锁机制,则乐观锁会失效。因此,针对不同的数据应有不同的策略,同前面许多情况一样,很多时候我们是在效率与安全/准确性上找一个平衡点,无论如何,优化都不是一个纯技术的问题,你应该对你的应用和业务特征有足够的了解。


第七点:结果集的使用:

  a) 完成同样一件事,HIBERNATE提供了可供选择的一些方式,但具体使用什么方式,可能用性能/代码都会有影响。显示,一次返回十万条记录(List/Set/Bag/Map等)进行处理,很可能导致内存不够的问题,而如果用基于游标(ScrollableResults)或Iterator的结果集,则不存在这样的问题。

  b) Session的load/get方法,前者会使用二级缓存,而后者则不使用。

  c) Query和list/iterator,如果去仔细研究一下它们,你可能会发现很多有意思的情况,二者主要区别(如果使用了Spring,在HibernateTemplate中对应find,iterator方法):

  i. list只能利用查询缓存(但在交易系统中查询缓存作用不大),无法利用二级缓存中的单个实体,但list查出的对象会写入二级缓存,但它一般只生成较少的执行SQL语句,很多情况就是一条(无关联)。

  ii. iterator则可以利用二级缓存,对于一条查询语句,它会先从数据库中找出所有符合条件的记录的ID,再通过ID去缓存找,对于缓存中没有的记录,再构造语句从数据库中查出,因此很容易知道,如果缓存中没有任何符合条件的记录,使用iterator会产生N+1条SQL语句(N为符合条件的记录数)

  iii. 通过iterator,配合缓存管理API,在海量数据查询中可以很好的解决内存问题,如:

  while(it.hasNext()){

  YouObject object = (YouObject)it.next();

  session.evict(youObject);

 sessionFactory.evice(YouObject.class, youObject.getId());

  }

  如果用list方法,很可能就出OutofMemory错误了。

  iv. 通过上面的说明,我想你应该知道如何去使用这两个方法了。

d)集合的选用

HIBERNATE 3.1文档的“19.5. Understanding Collection performance”中有详细的说明。

list()和iterator()区别

查询方式:

list只能利用查询缓存(但在交易系统中查询缓存作用不大),无法利用二级缓存中的单个实体,但是list查出的对象会写入二级缓存,但它一般只生成较少的sql语句,很多情况就是一条。

iterator则利用二级缓存,对于一条查询语句,它会先从数据库中找到所有符合条件的记录的ID,在通过ID去缓存找,对于缓存中没有的记录,在构造语句从数据库查出,第一次的执行会产生N+1条SQL语句。

产生结果:

用list可能会溢出

通过Iterator,配合缓存管理API,在海量数据查询中可以很好的解决内存问题。

综合考虑

一般List会填充二级缓存,却不能利用二级缓存,而Iterator可以读二级缓存,然而无法命中的话,效率很低效。一般处理方法,就是第一次查询使用list,随后使用iterator查询。

总结

 

Hibernate优化总结还有主配置、方法选用、事物控制没有涉及到,因为它们相对来说这些方面比较简单,但是还是很重要的。

在实施一个项目的时候我们没有必要想这些问题,做项目的时候第一步运行起来,第二步优化一下。在很多小型项目中第二步一般都不会去做,所以说我们做工程的时候还是要牢记运行出来,假如自己作为研究或者这个问题比较严重的话我们才考虑优化。

Hibernate调优方面没有最有只有更优,让我们不断积极找到优化的方法,来优化我们的程序,来优化我们自己。

原创粉丝点击