MySQL 乱码之我见
来源:互联网 发布:动态域名解析软件排名 编辑:程序博客网 时间:2024/06/01 11:04
先着重介绍一下mysql的字符集,这样能对产生mysql的根源有一个了解。
mysql 的字符集支持有两个方面:字符集(Character set)和排序方式(Collation)。另外对于字符集的支持细化到四个层次: 服务器(server),数据库(database),数据表(table)和连接(connection)。
连上mysql 后使用status 命令,可以看到类似如下输出:
>mysql statusConnection id: 305Current database:Current user: root@localhostSSL: Not in useCurrent pager: stdoutUsing outfile: ''Using delimiter: ;Server version: 5.6.23 MySQL Community Server (GPL)Protocol version: 10Connection: Localhost via UNIX socketServer characterset: utf8Db characterset: utf8Client characterset: utf8Conn. characterset: utf8
Server characterset 就是mysql默认字符集,当创建数据库没有指定字符集时数据库就采用此默认值。可以在mysql的配置文件中的 mysqld 段中对此值进行修改
[mysqld]port = 3306socket = /tmp/mysql.sockcharacter-set-server = utf8collation-server = utf8_general_ci
Db characterset:是当前数据库默认的字符集,当创建表时没有指定字符集,此表就使用当前默认值。例如创建一个 db_test 数据库,字符集使用 latin1
CREATE DATABASE `db_test` CHARACTER SET 'latin1' COLLATE 'latin1_swedish_ci';use db_test;
然后再使用 status 命令,可以看到这个时候 Db characterset 变为 latin1 了
>mysql statusConnection id: 305Current database: db_testCurrent user: root@localhostSSL: Not in useCurrent pager: stdoutUsing outfile: ''Using delimiter: ;Server version: 5.6.23 MySQL Community Server (GPL)Protocol version: 10Connection: Localhost via UNIX socketServer characterset: utf8Db characterset: latin1Client characterset: utf8Conn. characterset: utf8
在数据库中分别创建两种表 test1 和 test2,其中 test1 使用默认字符集, test2 指定字符集为GBK
create table test1 (name varchar(20));create table test2 (name varchar(20)) default charset=GBK;
使用 show create table 命令查看上述两张表,可以看到 test1 使用了当前数据库的默认字符集latin1,而test2使用的字符集是GBK。
mysql> show create table test1;+-------+-------------------------------------------------------------------------------------------------+| Table | Create Table |+-------+-------------------------------------------------------------------------------------------------+| test1 | CREATE TABLE `test1` ( `name` varchar(20) DEFAULT NULL) ENGINE=InnoDB DEFAULT CHARSET=latin1 |+-------+-------------------------------------------------------------------------------------------------+mysql> show create table test2;+-------+----------------------------------------------------------------------------------------------+| Table | Create Table |+-------+----------------------------------------------------------------------------------------------+| test2 | CREATE TABLE `test2` ( `name` varchar(20) DEFAULT NULL) ENGINE=InnoDB DEFAULT CHARSET=gbk |+-------+----------------------------------------------------------------------------------------------+
mysql 存储信息最终是已二进制的形式来存储的。所以在存储之前就需要对信息进行编码,同时从数据库读取信息后需要解码。具体使用那种编码、解码方式就是根据Client characterset以及表对应的字符集,如果没有显示的指定,那么会有一个默认值。当使用命令行的方式连接mysql,可以在mysql 配置中 mysql 段来指定默认Client characterset。例如:
[client]port = 3306socket = /tmp/mysql.sockdefault-character-set = utf8
也可以使用在连接时候指定
mysql -uroot -p --default-character-set=utf8
另外在登录mysql 后也可以使用 set names 来指定
set names utf8
关于优先级,set names utf8 最高,mysql -uroot -p --default-character-set=utf8 其次、my.cnf 最后。
上面对字符集做了一个简单的介绍,建议大家也把上面的mysql 命令试一下,这样理解或更加深刻。现在再来说一下乱码的情况,一般出现乱码就是因为字符集(编码)不同,换句话说就是当字符集(编码)一致时就不会出现乱码。前面介绍了一下字符集,所以知道了好几种,那到底是需要什么字符集一致呢?答案是:Client characterset 与 数据库表的字符集。 下面还是通过例子来说明,使用上面创建的表 test1。
由于test1使用的字符集是 latin1,那么使用下面的方式连上mysql
mysql -uroot -p db_test --default-character-set=latin1
再次确认一下Client characterset 与 数据库表的字符集
mysql> status--------------mysql Ver 14.14 Distrib 5.6.23, for osx10.8 (x86_64) using EditLine wrapperConnection id: 310Current database: db_testCurrent user: root@localhostSSL: Not in useCurrent pager: stdoutUsing outfile: ''Using delimiter: ;Server version: 5.6.23 MySQL Community Server (GPL)Protocol version: 10Connection: Localhost via UNIX socketServer characterset: utf8Db characterset: latin1Client characterset: latin1Conn. characterset: latin1-------------------------mysql> show create table test1;+-------+-------------------------------------------------------------------------------------------------+| Table | Create Table |+-------+-------------------------------------------------------------------------------------------------+| test1 | CREATE TABLE `test1` ( `name` varchar(20) DEFAULT NULL) ENGINE=InnoDB DEFAULT CHARSET=latin1 |+-------+-------------------------------------------------------------------------------------------------+
可以看到Client characterset与表的字符集是一致的,然后插入一条含有中文的记录,同时查询看看。
mysql> insert into test1(name) values('中test文1234测试');mysql> select * from test1;+----------------------+| name |+----------------------+| 中test文1234测试 |+----------------------+
现在证明当Client characterset与表的字符集一致时,没有出现乱码。那现在使用set names 来修改一下 Client characterset 看看效果。
mysql> set names utf8;Query OK, 0 rows affected (0.00 sec)mysql> status--------------mysql Ver 14.14 Distrib 5.6.23, for osx10.8 (x86_64) using EditLine wrapperConnection id: 310Current database: db_testCurrent user: root@localhostSSL: Not in useCurrent pager: stdoutUsing outfile: ''Using delimiter: ;Server version: 5.6.23 MySQL Community Server (GPL)Protocol version: 10Connection: Localhost via UNIX socketServer characterset: utf8Db characterset: latin1Client characterset: utf8Conn. characterset: utf8mysql> select * from test1;+--------------------------------------+| name |+--------------------------------------+| ä¸testæ–‡1234测试 |+--------------------------------------+
utf8 出现乱码,再试试gbk
mysql> set names gbk;Query OK, 0 rows affected (0.00 sec)mysql> status--------------mysql Ver 14.14 Distrib 5.6.23, for osx10.8 (x86_64) using EditLine wrapperConnection id: 310Current database: db_testCurrent user: root@localhostSSL: Not in useCurrent pager: stdoutUsing outfile: ''Using delimiter: ;Server version: 5.6.23 MySQL Community Server (GPL)Protocol version: 10Connection: Localhost via UNIX socketServer characterset: utf8Db characterset: latin1Client characterset: gbkConn. characterset: gbkmysql> select * from test1;+------------------------+| name |+------------------------+| ???test?1234???? |+------------------------+
上面把Client characterset 设置分别设置为 utf8 或 GBK 后,然后查询都出现了乱码,而且乱码显示还不一样。下面再测试一样不同Client characterset字符集先插入在读取的情况。
mysql -uroot -p db_test --default-character-set=utf8 mysql> status--------------mysql Ver 14.14 Distrib 5.6.23, for osx10.8 (x86_64) using EditLine wrapperConnection id: 312Current database: db_testCurrent user: root@localhostSSL: Not in useCurrent pager: stdoutUsing outfile: ''Using delimiter: ;Server version: 5.6.23 MySQL Community Server (GPL)Protocol version: 10Connection: Localhost via UNIX socketServer characterset: utf8Db characterset: latin1Client characterset: utf8Conn. characterset: utf8mysql> truncate table test1;Query OK, 0 rows affected (0.01 sec)mysql> select * from test1;Empty set (0.00 sec)mysql> insert into test1(name) values('中test文1234测试'); Query OK, 1 row affected, 1 warning (0.00 sec)mysql> select * from test1;+--------------+| name |+--------------+| ?test?1234?? |+--------------+
上面的例子说明当字符集不一致出现乱码了。 如果再把Client characterset 修改为和数据库表一致,然后看看刚刚插入的记录是否还是显示乱码
mysql> set names latin1;Query OK, 0 rows affected (0.00 sec)mysql> select * from test1;+--------------+| name |+--------------+| ?test?1234?? |+--------------+1 row in set (0.00 sec)
还是乱码,也就是通过字符集设置也无法把乱码还原了
通过上面这些例子可以得出结论,只有当Client characterset与表的字符集一致才不会出现乱码。
转载:https://segmentfault.com/a/1190000002919949
- MySQL 乱码之我见
- tomcat6 中文乱码之我见
- html中文乱码之我见
- MySQL开发规范之我见
- oracle项目移植mysql之我见
- Oracle与MySQL区别之我见
- Mysql之我见一(基础知识)
- Mysql之我见二(索引)
- Mysql之我见三(join查询)
- Mysql之我见四(索引优化)
- Mysql之我见十(行锁)
- Mysql之我见八(锁)
- Mysql之我见九(表锁)
- 在windows iis5下安装php4.0+mysql之我见
- MySQL开发规范之我见(更新版)---叶老师
- [置顶]老叶观点:MySQL开发规范之我见
- 老叶观点:MySQL开发规范之我见
- Mysql之我见六(查询截取分析)
- MySQL数据库中存储引擎问题
- 随手写的一些异想天开的程序(1)
- 4412芯片GPIO功能说明
- HTTP报文
- Tips on non-standard evaluation in R
- MySQL 乱码之我见
- id和instancetype的区别
- zoj 3203 Light Bulb(三分)
- 自定义View需注意问题
- 20160524 数据分析与SAS1 数据模型
- iOS完整App资源收集
- 关于URLEncoder.encode和URLDecoder.decode的用法
- Delphi学习笔记五——方法
- bzoj 3150: [Ctsc2013]猴子 高斯消元