MySQL存储引擎分析及业务使用场景

来源:互联网 发布:境外网络代理 编辑:程序博客网 时间:2024/06/05 16:17

MySQL存储引擎分析及业务使用场景

近几年,开源数据库逐渐流行起来。由于具有免费使用、配置简单、稳定性好、性能优良等优点,开源数据库在中低端应用上占据了很大的市场份额,而MySQL 正是开源数据库中的杰出代表。

MySQL 数据库隶属于MySQL AB 公司,总部位于瑞典。公司名中的“AB”是瑞典语“aktiebolag”或“股份公司”的首字母缩写。MySQL 支持几乎所有的操作系统。今天我们来讲讲MySQL的所使用的几种存储引擎。

和大多数数据不一样,MySQL是有存储引擎的概念的,在不同的业务场景中我们可以根据业务的需求来使用不同的存储引擎,甚至我们还可以根据自己业务的需求来自己编写存储引起插件。在MySQL 5.0 支持的存储引擎包括MyISAM、InnoDB、BDB、MEMORY、MERGE、EXAMPLE、NDB Cluster、ARCHIVE、CSV、BLACKHOLE、FEDERATED 等,今天我们挑平时常用的几款存储引擎插件来聊聊。

MySQL存储引擎分析及业务使用场景

  • MyISAM

  • 特性

  1. 不支持事务:MyISAM存储引擎不支持事务,所以对事务有要求的业务场景不能使用

  2. 表级别的锁定:其锁定机制是表级索引,这虽然可以让锁定的实现成本很小但是也同时大大降低了其并发性能

  3. 读写互相阻塞:不仅会在写入的时候阻塞读取数据,MyISAM还会在读取数据的时候阻塞写入,但读数据的进程本身并不会阻塞另外读数据的进程

  4. 只会缓存索引:MyISAM可以通过key_buffer缓存以大大提高访问性能减少磁盘IO,但是这个缓存区只会缓存索引,而不会缓存数据

  • 适用场景

  1. 不需要事务支持(不支持)

  2. 并发相对较低(锁定机制问题)

  3. 数据修改相对较少(阻塞问题)

  4. 以读为主

  5. 数据一致性要求不是非常高

  • 最佳实践

  1. 尽量索引(缓存机制)

  2. 调整读写优先级,根据实际需求确保重要操作更优先

  3. 启用延迟插入改善大批量写入性能

  4. 尽量顺序操作让insert数据都写入到尾部,减少阻塞

  5. 分解大的操作,降低单个操作的阻塞时间

  6. 降低并发数,某些高并发场景通过应用来进行排队机制

  7. 对于相对静态的数据,充分利用Query Cache可以极大的提高访问效率

  8. MyISAM的Count只有在全表扫描的时候特别高效,带有其他条件的count都需要进行实际的数据访问

MySQL存储引擎分析及业务使用场景

  • InnoDB(现阶段使用最多的一种存储引擎)

  • 特性

  1. 具有较好的事务支持:支持4个事务隔离级别,支持多版本读

  2. 行级锁定:通过索引实现,全表扫描仍然会是表锁,注意间隙锁的影响

  3. 读写阻塞与事务隔离级别相关

  4. 具有非常高效的缓存特性:能缓存索引,也能缓存数据

  5. 整个表和主键以Cluster方式存储,组成一颗平衡树

  6. 所有Secondary Index都会保存主键信息

  • 适用场景

  1. 需要事务支持(具有较好的事务特性)

  2. 行级锁定对高并发有很好的适应能力,但需要确保查询是通过索引完成

  3. 数据更新较为频繁的场景

  4. 数据一致性要求较高

  5. 硬件设备内存较大,可以利用InnoDB较好的缓存能力来提高内存利用率,尽可能减少磁盘 IO

  • 最佳实践

  1. 主键尽可能小,避免给Secondary index带来过大的空间负担

  2. 避免全表扫描,因为会使用表锁

  3. 尽可能缓存所有的索引和数据,提高响应速度

  4. 在大批量小插入的时候,尽量自己控制事务而不要使用autocommit自动提交

  5. 合理设置innodb_flush_log_at_trx_commit参数值,不要过度追求安全性

  6. 避免主键更新,因为这会带来大量的数据移动

  • NDBCluster

  • 特性

  1. 分布式:分布式存储引擎,可以由多个NDBCluster存储引擎组成集群分别存放整体数据的一部分

  2. 支持事务:和Innodb一样,支持事务

  3. 可与mysqld不在一台主机:可以和mysqld分开存在于独立的主机上,然后通过网络和mysqld通信交互

  4. 内存需求量巨大:新版本索引以及被索引的数据必须存放在内存中,老版本所有数据和索引必须存在与内存中

  • 适用场景

  1. 具有非常高的并发需求

  2. 对单个请求的响应并不是非常的critical

  3. 查询简单,过滤条件较为固定,每次请求数据量较少,又不希望自己进行水平Sharding

  • 最佳实践

  1. 尽可能让查询简单,避免数据的跨节点传输

  2. 尽可能满足SQL节点的计算性能,大一点的集群SQL节点会明显多余Data节点

  3. 在各节点之间尽可能使用万兆网络环境互联,以减少数据在网络层传输过程中的延时.

以上三种MySQL引擎是我们平时在应用中使用最多也是最常见的几种,希望分享给大家,能给各位在项目中对MySQL这样一款优秀的开源数据库根据自己的业务场景来选用数据库存储引擎带来一点帮助。

0 0
原创粉丝点击