MySQL HandlerSocket in Action

来源:互联网 发布:js触发select点击事件 编辑:程序博客网 时间:2024/06/01 08:02

1 Overview

    最近一篇关于MySQL HandlerSocket的blog吸引了不少人的注意,甚至MySQL Performance Blog上也有关于HandlerSocket的性能评测。该blog中声称对于一个CPU bound而非IO bound的MySQL Server(即绝大部分的数据可以从缓存中取得,例如InnoDB Buffer Pool有接近100%的命中率),使用HandlerSocket可以将查询性能提升7.5倍。目前HandlerSocket已经被其作者应用到生产环境,效果良好。笔者在昨天抽空安装并试用了一下HandlerSocket Plugin。

 

2 Installation

    安装的过程基本顺利,不过可能是由于笔者是在MySQL 5.1.42+InnoDB Plugin 1.0.6上编译安装HandlerSocket的原因,编译HandlerSocket的过程中报如下错误:

    configure: error: MySQL source version does not match MySQL binary version

    调查一下后发现是configure脚本没有能够找到MySQL source的版本。笔者调整了configure脚本,跳过了该检查。编译安装后会在MySQL的plugin目录中生成一个so文件。然后在MySQL中安装该plugin即可。

Sql代码 
  1. mysql> INSTALL PLUGIN handlersocket soname 'handlersocket.so';  
  2. mysql> show plugins;  
  3. +---------------------+----------+--------------------+---------------------+---------+  
  4. Name                | Status   | Type               | Library             | License |  
  5. +---------------------+----------+--------------------+---------------------+---------+  
  6. | handlersocket       | ACTIVE   | DAEMON             | handlersocket.so    | BSD     |  
  7. 18 rows in set (0.00 sec)  

 

3 Getting Started

    首先创建一个测试用的表。

Sql代码 
  1. mysql> CREATE TABLE `user` (  
  2.   `user_id` int(10) unsigned NOT NULL,  
  3.   `user_name` varchar(50) DEFAULT NULL,  
  4.   `user_email` varchar(255) DEFAULT NULL,  
  5.   `created` datetime DEFAULT NULL,  
  6.   PRIMARY KEY (`user_id`),  
  7.   KEY `INDEX_01` (`user_name`)  
  8. ) ENGINE=InnoDB  
  9.   
  10. mysql> insert into user values(1, "John""john@test.com"CURRENT_TIMESTAMP);  
  11. mysql> insert into user values(2, "Kevin""Kevin@test.com"CURRENT_TIMESTAMP);  
  12. mysql> insert into user values(3, "Dino""Dino@test.com"CURRENT_TIMESTAMP);  
   

    接下来按照blog中的例子,编写如下perl脚本handlersocket.pl。

Perl代码 
  1. #!/usr/bin/perl  
  2.   
  3. use strict;  
  4. use warnings;  
  5. use Net::HandlerSocket;  
  6.   
  7. #1. establishing a connection  
  8. my $args = { host => 'localhost', port => 9998 };  
  9. my $hs = new Net::HandlerSocket($args);  
  10.   
  11. #2. initializing an index so that we can use in main logics.  
  12. # MySQL tables will be opened here (if not opened)  
  13. my $res = $hs->open_index(0'test''user''INDEX_01''user_name,user_email,created');  
  14. die $hs->get_error() if $res != 0;  
  15.   
  16. #3. main logic  
  17. #fetching rows by id  
  18. #execute_single (index id, cond, cond value, max rows, offset)  
  19. $res = $hs->execute_single(0'=', [ 'kevin' ], 10);  
  20. die $hs->get_error() if $res->[0] != 0;  
  21. shift(@$res);  
  22. for (my $row = 0; $row < 1; ++$row) {  
  23.   my $user_name= $res->[$row + 0];  
  24.   my $user_email= $res->[$row + 1];  
  25.   my $created= $res->[$row + 2];  
  26.   print "$user_name/t$user_email/t$created/n";  
  27. }  
  28.   
  29. #4. closing the connection  
  30. $hs->close();  

 

    最后执行handlersocket.pl,结果如下:

Shell代码 
  1. perl handlersocket.pl  
  2. Kevin   Kevin@test.com  2010-11-14 22:35:22  
 

4 Philosophy of the HandlerSocket

    通常,MySQL Server可以被看成两层架构:即SQL Layer和Storage Engine Layer,它们之间通过Handler API进行交互。MySQL Server在接收到客户端的Query请求后,通常需要在SQL layer中进行词法分析,语法分析,优化等过程,最终生成一个树型的查询计划,交由执行引擎执行。执行引擎根据查询计划,跟相应的存储引擎通信,得到查询结果。

 

    HandlerSocket的作者认为,对于CPU bound的MySQL server来说,SQL layer消耗了过多的资源,以致总体性能不佳。HandlerSocket则绕过了MySQL Server的SQL layer,直接跟存储引擎交互,从而带来了大幅的性能提升。默认情况下HandlerSocket Plugin监听9998和9999两个端口,其中9998只支持读操作,9999支持读写操作,但是性能跟9998端口相比稍慢。

 

    HandlerSocket的作者在其blog中列出了一系列HandlerSocket的优点,以下是笔者认为其中比较重要的:

  • Can handle lots of concurrent connections
  • Extremely high performance
  • No duplicate cache
  • No data inconsistency
  • Independent from storage engines
  • Supporting lots of query patterns
  • No need to modify/rebuild MySQL
  • All operational benefits from MySQL

      其中No duplicate cache和No data inconsistency这两条,笔者感触颇深。关于MySQL的NoSQL扩展,可能很多项目都在使用memcached,或者自己实现的cache等。这种独立缓存的实现方式有个重要的局限,即如何保证MySQL和cache之间的数据一致性,尽管Memcached Functions for MySQL(基于Trigger和MySQL UDF)从某种程度上提供了一种解决方案。

     此外,关于Independent from storage engines和Supporting lots of query patterns。理论上通过Handler API可以和任何存储引擎交互,但是目前HandlerSocket只是在InnoDB Plugin上进行了测试。此外,HandlerSocket的作者在其blog上指出,通过HandlerSocket,不仅可以通过主键查询,也可以通过普通索引,甚至不使用索引进行查询(包括范围查询),甚至还可以进行insert/update/delete等写操作。

    关于All operational benefits from MySQL,正如在其blog中提到的,可以比较方便地通过MySQL的既存功能对HandlerSocket进行监控,例如以下几个监控指标:

Sql代码 
  1. mysql> show global status like 'handler_read%';  
  2. mysql> show global status like 'Com_select%';  
  3. mysql> show global status like 'InnoDB_rows_read';  
 

5 Client API

    遗憾的是到目前为止,HandlerSocket只有C和Perl的客户端API,Java和Python等版本的客户端API貌似在开发中。在这里简单分析一下Perl版本的客户端API。

 

5.1 Connection

    与HandlerSocket Plugin创建连接的方式如下:

Perl代码 
  1. use Net::HandlerSocket;  
  2. my $args = { host => 'localhost', port => 9998 };  
  3. my $hs = new Net::HandlerSocket($args);  

    其中Net::HandlerSocket模块存放于HandlerSocket的分发tar包的perl-Net-HandlerSocket目录中,编译安装方式如下:

Shell代码 
  1. cd perl-Net-HandlerSocket/  
  2. perl Makefile.PL  
  3. make  
  4. make install  
 

5.2 Opening index

    在进行操作之前,首先需要打开一个索引,如下:

Perl代码 
  1. my $err = $hs->open_index(3'database1''table1''PRIMARY''f1,f2');  
  2. die $hs->get_error() if $res->[0] != 0;  

    其中'database1'为schema名,'table1'为表名,'PRIMARY'为索引名,'f1,f2'为查询的列名。关于方法的open_index的第一个参数3,用来在每个Net::HandlerSocket对象中唯一标识一个表名。

 

5.3 Query

    通过execute_single方法进行查询,例如:

Perl代码 
  1. my $res = $hs->execute_single(3'=', [ 'foo' ], 10);  
  2. die $hs->get_error() if $res->[0] != 0;  
  3. shift(@$res);  

    execute_single方法的第一个参数需要跟之前open_index方法的第一个参数一致。第二个参数'='指定了检索条件,目前支持'=', '>=', '<=', '>'和'<'。第三个参数[ 'foo' ]为一个arrayref,指定了检索的key,其长度必须小于或者等于对应索引的列数。第四个和第五个参数指定了查询的limit和offset。

 

    execute_single方法的返回值类型为arrayref,其第一个元素为error code:

  • 0:正常。
  • 负数:I/O 错误,对应的Net::HandlerSocket对象需要被丢弃。
  • 正数:其它错误,但是与HandlerSocket Plugin的连接仍然正常可用,因此对应的Net::HandlerSocket对象可以继续使用。

    第一个元素之后的其它元素即查询结果,如果返回的row数大于1,那么也是存放在这个一维数组中。假设查询结果共5行,每行三列,那么对应的代码如下:

Perl代码 
  1. die $hs->get_error() if $res->[0] != 0;  
  2. shift(@$res);  
  3. for (my $row = 0; $row < 5; ++$row) {  
  4.   for (my $col = 0; $col < 3; ++$col) {  
  5.     my $value = $res->[$row * 5 + $col];  
  6.     # ...  
  7.   }  
  8. }  

 

5.4 Insert records

    execute_single方法也可以用来插入记录,例如:

Perl代码 
  1. my $args = { host => 'localhost', port => 9999 };  
  2. my $hs = new Net::HandlerSocket($args);  
  3.   
  4. my $res = $hs->execute_single(3'+', [ 'foo''bar''baz' ]);  
  5. die $hs->get_error() if $res->[0] != 0;  
  6. my $num_inserted_rows = $res->[1];  

    需要注意的是,此时连接的是9999端口,因为9998端口只支持读操作。

 

5.5 Update or delete records

    对于更新和删除操作,同样使用execute_single方法,例如:

Perl代码 
  1. my $args = { host => 'localhost', port => 9999 };  
  2. my $hs = new Net::HandlerSocket($args);  
  3.   
  4. my $res = $hs->execute_single(3'=', [ 'bar' ], 10'U', [ 'fubar''hoge' ]);  
  5. die $hs->get_error() if $res->[0] != 0;  
  6. my $num_updated_rows = $res->[1];  
  7.   
  8. my $res = $hs->execute_single(3'=', [ 'baz' ], 10'D');  
  9. die $hs->get_error() if $res->[0] != 0;  
  10. my $num_deleted_rows = $res->[1];  

    execute_single方法的第六个参数指定的操作类型,目前支持'U'和'D'。对于'U'操作,execute_single方法的第七个参数指定了更新后的值;对于'D'操作,第七个参数被忽略。

 

5.6 Multiple operations

    可在一次调用中执行多个操作,这样速度更快,例如:

Perl代码 
  1. my $rarr = $hs->execute_multi([  
  2.   [ 0'>=', [ 'foo' ], 50 ],  
  3.   [ 2'=', [ 'bar' ], 10 ],  
  4.   [ 4'<', [ 'baz' ], 105 ],  
  5. ]);  
  6. for my $res (@$rarr) {  
  7.   die $hs->get_error() if $res->[0] != 0;  
  8.   shift(@$res);  
  9.   # ...  
  10. }  
 

6 Reference

    http://yoshinorimatsunobu.blogspot.com/2010/10/using-mysql-as-nosql-story-for.html (翻)

    http://www.mysqlperformanceblog.com/2010/11/02/handlersocket-on-ssd/

 

原文地址:http://whitesock.iteye.com/blog/811339

原创粉丝点击