extended-insert对mysqldump及导入性能的影响
来源:互联网 发布:中国房地产 知乎 编辑:程序博客网 时间:2024/05/16 06:30
1. 环境描述
SuSE 11 sp1 x86_64 + MySQL 5.5.37
blog地址:http://blog.csdn.net/hw_libo/article/details/39583247
测试表order_line有3.2亿数据,大小约37G:
NDSC02:/data/mysql/mysql3306/data/tpcc1000 # du -shl order_line.*12Korder_line.frm37Gorder_line.ibd
mysql> show table status like 'order_line';+------------+--------+---------+------------+-----------+----------------+-------------+-----------------+--------------+-----------+--| Name | Engine | Version | Row_format | Rows | Avg_row_length | Data_length | Max_data_length | Index_length | Data_free | A+------------+--------+---------+------------+-----------+----------------+-------------+-----------------+--------------+-----------+--| order_line | InnoDB | 10 | Compact | 328191117 | 84 | 27771404288 | 0 | 10846420992 | 6291456 | +------------+--------+---------+------------+-----------+----------------+-------------+-----------------+--------------+-----------+--1 row in set (0.09 sec)
MySQL的my.cnf配置:
# InnoDB variablesinnodb_data_file_path = ibdata1:1G:autoextendinnodb_buffer_pool_size = 35Ginnodb_file_per_table = 1innodb_thread_concurrency = 20 innodb_flush_log_at_trx_commit = 1innodb_log_buffer_size = 16Minnodb_log_file_size = 256Minnodb_log_files_in_group = 3innodb_max_dirty_pages_pct = 50innodb_lock_wait_timeout = 120innodb_rollback_on_timeoutinnodb_status_file = 1transaction_isolation = READ-COMMITTED
bulk_insert_buffer_size<span style="white-space:pre"></span>= 64M
2. 使用mysqldump导出该表
参数说明:
-e, --extended-insert,长INSERT,多row在一起批量INSERT,提高导入效率,和没有开启 -e 的备份导入耗时至少相差3、4倍,默认开启;用--extended-insert=false关闭。强烈建议开启,通过下面的测试比较就会明白为什么了。
(1)默认方式导出,也即--extended-insert=true
# time mysqldump -S /tmp/mysql.sock -uroot -proot --single-transaction -B tpcc1000 --tables order_line > ./tpcc1000_order_line1.sqlreal 7m38.824suser 6m44.777ssys 0m50.627s
NDSC02:/opt/mysql/backup # ls -l tpcc1000_order_line1.sql -rw-r--r-- 1 root root 24703941064 09-26 16:39 tpcc1000_order_line1.sqlNDSC02:/opt/mysql/backup # du -sh tpcc1000_order_line1.sql 24G tpcc1000_order_line1.sql
# time mysqldump -S /tmp/mysql.sock -uroot -proot --single-transaction --extended-insert=false -B tpcc1000 --tables order_line > ./tpcc1000_order_line2.sqlreal 9m36.340suser 8m18.219ssys 1m12.241s
NDSC02:/opt/mysql/backup # ls -l tpcc1000_order_line2.sql -rw-r--r-- 1 root root 35094700366 09-26 16:49 tpcc1000_order_line2.sqlNDSC02:/opt/mysql/backup # du -sh tpcc1000_order_line2.sql 33G tpcc1000_order_line2.sql可见,默认情况下(--extended-insert=true),导出37G的表,耗时7分38秒,导出文件为24G,如果关闭--extended-insert=false,同样的表,导出时耗时9分36秒,且导出文件为33G。
我测试过两次,基本一样。可以导出文件时,开启--extended-insert=true是必须的,这样导出文件小,耗时也比较少。
3. 导入的影响
这里说说默认情况下(--extended-insert=true)导出的文件与使用--extended-insert=false导出的文件在导入时的性能影响。
说明:innodb_flush_log_at_trx_commit=2
这里使用了测试表orders,表的大小为2.6GB,行数为31493000行,下面是导出文件:
# du -sh tpcc1000_orders*1.4Gtpcc1000_orders1.sql ## 使用默认情况下(--extended-insert=true)导出的文件2.3Gtpcc1000_orders2.sql ## 使用--extended-insert=false导出的文件
(1)导入默认情况下(--extended-insert=true)导出的表
# time mysql -f -S /tmp/mysql.sock -uroot -proot test < ./tpcc1000_orders1.sqlreal 12m2.184suser 0m28.538ssys 0m1.460s
(2)导入使用--extended-insert=false导出的表
# time mysql -f -S /tmp/mysql3308.sock -uroot -proot bosco2 < ./tpcc1000_orders2.sqlreal 276m39.231s ## 约4.6小时user 8m13.391ssys 6m20.120s
经过上面的一比较,发现导入速度相差非常多。
那么使用--extended-insert=false导出表是不是一无是处呢?
并非如此。比如数据库中表中已经存在大量数据,那么再往表中导入数据时,如果出现主键数据冲突Duplicate key error,将会导致导入操作失败,但此时如果是使用--extended-insert=false导出表,导入时主键冲突的会报错Duplicate key error,但不冲突的数据仍然能正常导入。
blog地址:http://blog.csdn.net/hw_libo/article/details/39583247
-- Bosco QQ:375612082
---- END ----
- extended-insert对mysqldump及导入性能的影响
- 大对象对数据库导出/导入性能的影响
- 影响HBase insert性能的几个因素
- 影响HBase insert性能的几个因素
- 简述tcp协议对http性能的影响及优化
- insert 操作对undo的影响
- sqlite3 update/insert/insert or replace对触发器的影响
- ToString()对性能的影响
- 视图对性能的影响
- synchronized 对性能的影响
- arraysize 对性能的影响
- 视图对性能的影响
- 文件系统对性能的影响
- mysqldump 的delay-insert选项
- malloc的标志对性能的影响
- 关于android SQLite 的insert操作对类型 REAL影响
- static局部变量对性能的影响
- Ajax 对Web性能的影响分析
- Introduction To SmartParts And Workspaces (Introduction To CAB/SCSF Part 15)
- 高精度乘法 【C++版(简单模拟版和FFT快速版)和java版】
- 树莓派开发系列教程10——树莓派spi液晶屏支持(fbtft)
- 【翻译】Basic MFC Reversing
- linux内存管理总结之内存分配
- extended-insert对mysqldump及导入性能的影响
- 开始写博客!!今天第一个:FFmpeg解码网络rtsp流的一般流程和这几天遇到的问题,尤其是avformat_input_open解析错误的网络串流长时间不返回!
- Android仿iPhone晃动撤销输入功能(微信摇一摇功能)
- IOS消息推送流程
- Android之loadUrl访问网络资源与本地资源的方法
- android edittext textwatcher的用法
- MySQL数据导出
- 在windows上安装和配置git工具
- SQL中的coalesce函数与case语句