Hibernate的优化

来源：互联网发布：视频批量合成软件编辑：程序博客网时间：2024/05/17 08:09

优化总结

要想优化Hibernate，我们必须知道应该从什么地方进行优化，从什么地方入手。Hibernate的优化方向：

数据库设计调整
HQL优化
API的正确使用(如根据不同的业务类型选用不同的集合及查询API)
主配置参数(日志，查询缓存，fetch_size, batch_size等)
映射文件优化(ID生成策略，二级缓存，延迟加载，关联优化)
　　一级缓存的管理
　　针对二级缓存，还有许多特有的策略
　　事务控制策略。

具体分析

第一点：数据库设计调整

前边博客介绍过数据库设计，今天我们还从这开始，表的设计就是建楼的基础，如何让基础简洁而结实这是最重要的。

优化策略：
1.建索引
2.减少表之间的关联
3.简化查询字段，没用的字段不要，已经对返回结果的控制，尽量返回少量数据
4.适当的冗余数据，不过分最求高范式
5.尽量不使用联合主键
6. ID的生成机制，不同的数据库所提供的机制并不完全一样

第二点：HQL优化

（HQL知识图）

假如想好好了解一下的建议看一下这篇博客HQL详细使用，我个人认为写的还可以，知识总结的很细致。

总结：
1.实体查询：可以使用sql语句查询
2.实体的更新和删除：hibernate3中直接提供更加灵活更加效率的解决方法
3.属性查询：动态构造实例对象，对结果集进行封装
4.分组与排序：
A.Order by子句
B.Group by子句与统计查询
C.优化统计查询：内连接，外连接
5.参数绑定：和jdbc一样，对hibernate的参数绑定提供了丰富的支持。

第三点：主配置

　a) 查询缓存，同下面讲的缓存不太一样，它是针对HQL语句的缓存，即完全一样的语句再次执行时可以利用缓存数据。但是，查询缓存在一个交易系统(数据变更频繁，查询条件相同的机率并不大)中可能会起反作用:它会白白耗费大量的系统资源但却难以派上用场。

　　b) fetch_size，同JDBC的相关参数作用类似，参数并不是越大越好，而应根据业务特征去设置

　　c) batch_size同上。

　　d) 生产系统中，切记要关掉SQL语句打印。

第三点：缓存

运行机制：
介于应用程序和物理数据源之间，其作用是为了降低应用程序对物理数据源访问的频数，从而提高运行性能。
缓存被广泛应用的用于优化数据库。当一些数据被从数据库中读取出来的时候，我们可以把它们放到缓存里。这样我们可以再次使用的时候直接从缓存中取出来，这样我们的效率就提高了很多。
控制范围：
一级缓存是session对象的生命周期通常对应的一个数据库事务或者一个应用事务，它是事务范围内的缓存
二级缓存是一个可插拔的缓存插件，它是由SessionFactory负责管理。由于SessionFactory对象的生命周期和应用程序的整个过程对应，所以二级缓存是进城范围或者集群范围内的缓存。用于初始化很少更改的数据、不重要的数据，不会并发访问的数据。

Hibernate缓存的一些问题和建议：hibernate的缓存

第四点：捉取策略

1. 捉取优化：Hibernate在关联关系之间进行导航，充分利用Hibernate提供的技术
2. 如何捉取
立即捉取：当捉取宿主对象时，同时捉取其相关对象和关联集以及属性
延迟加载：当捉宿主对象时，并不捉取其关联对象，而是当对其对象进行调用时才加载。
3. 捉取粒度：设置捉取个数

a) 实体延迟加载:通过使用动态代理实现
b) 集合延迟加载:通过实现自有的SET/LIST，HIBERNATE提供了这方面的支持
c) 属性延迟加载:

第五点：批量数据处理（修改和删除）

即使是使用JDBC，在进行大批数据更新时，BATCH与不使用BATCH有效率上也有很大的差别。我们可以通过设置batch_size来让其支持批量操作。
　　举个例子，要批量删除某表中的对象，如“delete Account”，打出来的语句，会发现HIBERNATE找出了所有ACCOUNT的ID，再进行删除，这主要是为了维护二级缓存，这样效率肯定高不了，在后续的版本中增加了bulk delete/update，但这也无法解决缓存的维护问题。也就是说，由于有了二级缓存的维护问题，HIBERNATE的批量操作效率并不尽如人意!

在Hibernate2中，如果需要对任何数据进行修改和删除操作都需要先执行查询操作，在得到数据后才进行修改和删除。
1. 不适用Hibernate API而是直接使用JDBC API来做原生态SQL语句进行查询，这种方法比较好，相对来说较快。
2. 运用存储过程
3. 一定量范围内可以使用hibernate API，但是特大数据量不行。

第六点：事务控制：

事务方面对性能有影响的主要包括:事务方式的选用，事务隔离级别以及锁的选用

　　 a) 事务方式选用:如果不涉及多个事务管理器事务的话，不需要使用JTA，只有JDBC的事务控制就可以。

　　 b) 事务隔离级别:参见标准的SQL事务隔离级别

　　 c) 锁的选用:悲观锁(一般由具体的事务管理器实现)，对于长事务效率低，但安全。乐观锁(一般在应用级别实现)，如在HIBERNATE中可以定义VERSION字段，显然，如果有多个应用操作数据，且这些应用不是用同一种乐观锁机制，则乐观锁会失效。因此，针对不同的数据应有不同的策略，同前面许多情况一样，很多时候我们是在效率与安全/准确性上找一个平衡点，无论如何，优化都不是一个纯技术的问题，你应该对你的应用和业务特征有足够的了解。

第七点：结果集的使用：

　　a) 完成同样一件事，HIBERNATE提供了可供选择的一些方式，但具体使用什么方式，可能用性能/代码都会有影响。显示，一次返回十万条记录(List/Set/Bag/Map等)进行处理，很可能导致内存不够的问题，而如果用基于游标(ScrollableResults)或Iterator的结果集，则不存在这样的问题。

　　b) Session的load/get方法，前者会使用二级缓存，而后者则不使用。

　　c) Query和list/iterator，如果去仔细研究一下它们，你可能会发现很多有意思的情况，二者主要区别(如果使用了Spring，在HibernateTemplate中对应find,iterator方法):

　　i. list只能利用查询缓存(但在交易系统中查询缓存作用不大)，无法利用二级缓存中的单个实体，但list查出的对象会写入二级缓存，但它一般只生成较少的执行SQL语句，很多情况就是一条(无关联)。

　　ii. iterator则可以利用二级缓存，对于一条查询语句，它会先从数据库中找出所有符合条件的记录的ID，再通过ID去缓存找，对于缓存中没有的记录，再构造语句从数据库中查出，因此很容易知道，如果缓存中没有任何符合条件的记录，使用iterator会产生N+1条SQL语句(N为符合条件的记录数)

　　iii. 通过iterator，配合缓存管理API，在海量数据查询中可以很好的解决内存问题，如:

　　while(it.hasNext()){

　　YouObject object = (YouObject)it.next();

　　session.evict(youObject);

　sessionFactory.evice(YouObject.class, youObject.getId());

　　}

　　如果用list方法，很可能就出OutofMemory错误了。

　　iv. 通过上面的说明，我想你应该知道如何去使用这两个方法了。

d)集合的选用

在HIBERNATE 3.1文档的“19.5. Understanding Collection performance”中有详细的说明。

list()和iterator()区别

查询方式：
list只能利用查询缓存（但在交易系统中查询缓存作用不大），无法利用二级缓存中的单个实体，但是list查出的对象会写入二级缓存，但它一般只生成较少的sql语句，很多情况就是一条。
iterator则利用二级缓存，对于一条查询语句，它会先从数据库中找到所有符合条件的记录的ID，在通过ID去缓存找，对于缓存中没有的记录，在构造语句从数据库查出，第一次的执行会产生N+1条SQL语句。
产生结果：
用list可能会溢出
通过Iterator，配合缓存管理API，在海量数据查询中可以很好的解决内存问题。
综合考虑：
一般List会填充二级缓存，却不能利用二级缓存，而Iterator可以读二级缓存，然而无法命中的话，效率很低效。一般处理方法，就是第一次查询使用list，随后使用iterator查询。

总结

Hibernate优化总结还有主配置、方法选用、事物控制没有涉及到，因为它们相对来说这些方面比较简单，但是还是很重要的。

在实施一个项目的时候我们没有必要想这些问题，做项目的时候第一步运行起来，第二步优化一下。在很多小型项目中第二步一般都不会去做，所以说我们做工程的时候还是要牢记运行出来，假如自己作为研究或者这个问题比较严重的话我们才考虑优化。

Hibernate调优方面没有最有只有更优，让我们不断积极找到优化的方法，来优化我们的程序，来优化我们自己。