[WEB]PHP的编码 与MySQL5.5的编码 适配
来源:互联网 发布:javascript index 编辑:程序博客网 时间:2024/05/04 21:32
问题描述:
PHP的页面编码默认是UTF-8的格式,但是MYSQL5的默认格式是latin1.
因而在php获取数据库中存储的中文并展示时,出现了乱码。
网上摘要:
基本概念
• 字符(Character)是指人类语言中最小的表义符号。例如’A'、’B'等;
• 给定一系列字符,对每个字符赋予一个数值,用数值来代表对应的字符,这一数值就是字符的编码(Encoding)。例如,我们给字符’A'赋予数值0,给字符’B'赋予数值1,则0就是字符’A'的编码;
• 给定一系列字符并赋予对应的编码后,所有这些字符和编码对组成的集合就是字符集(Character Set)。例如,给定字符列表为{’A',’B'}时,{’A'=>0, ‘B’=>1}就是一个字符集;
• 字符序(Collation)是指在同一字符集内字符之间的比较规则;
• 确定字符序后,才能在一个字符集上定义什么是等价的字符,以及字符之间的大小关系;
• 每个字符序唯一对应一种字符集,但一个字符集可以对应多种字符序,其中有一个是默认字符序(Default Collation);
• MySQL中的字符序名称遵从命名惯例:以字符序对应的字符集名称开头,规则如下
1. <character set>_<language/other>_<ci/cs>
2. <character set>_bin
以_ci(表示大小写不敏感)、_cs(表示大小写敏感)或_bin(表示按编码值比较)结尾。例如:在字符序“utf8_general_ci”下,字符“a”和“A”是等价的;
• 系统变量:– character_set_server:默认的内部操作字符集
– character_set_client:客户端来源数据使用的字符集
– character_set_connection:连接层字符集
– character_set_results:查询结果字符集
– character_set_database:当前选中数据库的默认字符集
– character_set_system:系统元数据(字段名等)字符集
– 还有以collation_开头的同上面对应的变量,用来描述字符序。
>show variables like 'character%'; +--------------------------+----------------------------+ | Variable_name | Value | +--------------------------+----------------------------+ | character_set_client | latin1 | | character_set_connection | latin1 | | character_set_database | latin1 | | character_set_filesystem | binary | | character_set_results | latin1 | | character_set_server | latin1 | | character_set_system | latin1 | | character_sets_dir | /usr/share/mysql/charsets/ | +--------------------------+----------------------------+
show variables like 'coll%';| collation_connection | latin1_swedish_ci| collation_database | latin1_swedish_ci| collation_server | latin1_swedish_ciMySQL按照下面的方式选择表字符集和字符序:
如果指定了CHARACTER SET X和COLLATE Y,那么采用CHARACTER SET X和COLLATE Y。
如果指定了CHARACTER SET X而没有指定COLLATE Y,那么采用CHARACTER SET X和CHARACTER SET X的默认字符序。
否则,采用服务器字符集和服务器字符序。
– 格式为:[_charset] ’string’ [COLLATE collation]
– 例如:
SELECT _latin1 ’string’;
SELECT _utf8 ‘你好’ COLLATE utf8_general_ci;
– 由introducer修饰的文本字符串在请求过程中不经过多余的转码,直接转换为内部字符集处理。
MySQL中的字符集转换过程
1. MySQL Server收到请求时将请求数据从character_set_client转换为character_set_connection;
2. 进行内部操作前将请求数据从character_set_connection转换为内部操作字符集,其确定方法如下:
- 使用每个数据字段的CHARACTER SET设定值;
- 若上述值不存在,则使用对应数据表的DEFAULT CHARACTER SET设定值(MySQL扩展,非SQL标准);
- 若上述值不存在,则使用对应数据库的DEFAULT CHARACTER SET设定值;
- 若上述值不存在,则使用character_set_server设定值。
3. 将操作结果从内部操作字符集转换为character_set_results。
产生乱码的可能:
a 我们的字段没有设置字符集,因此使用表的数据集
b 我们的表没有指定字符集,默认使用数据库存的字符集
c 我们的数据库在创建的时候没有指定字符集,因此使用character_set_server设定值
d 我们没有特意去修改character_set_server的指定字符集,因此使用mysql默认
e mysql默认的字符集是latin1,因此,我们使用了latin1字符集,而我们character_set_connection的字符集是UTF-8,插入中文乱码也再所难免了。
MySQL默认字符集
MySQL对于字符集的指定可以细化到一个数据库,一张表,一列.传统的程序在创建数据库和数据表时并没有使用那么复杂的配置,它们用的是默认的配置。(1)编译MySQL 时,指定了一个默认的字符集,这个字符集是 latin1;
(2)安装MySQL 时,可以在配置文件 (my.ini) 中指定一个默认的的字符集,如果没指定,这个值继承自编译时指定的;
(3)启动mysqld 时,可以在命令行参数中指定一个默认的的字符集,如果没指定,这个值继承自配置文件中的配置,此时 character_set_server 被设定为这个默认的字符集;
(4)安装 MySQL选择多语言支持,安装程序会自动在配置文件中把default_character_set 设置为 UTF-8,保证缺省情况下所有的数据库所有表的所有列的都用 UTF-8 存储。
修改默认字符集
(1) 最简单的修改方法,就是修改mysql的my.ini文件中的字符集键值,如 default-character-set = utf8 #[client]
character_set_server = utf8 #[mysqld] 部分网友说的default-character-set 会导致5版本的mysql无法启动。
修改完后,重启mysql的服务。
mysql> SET character_set_client = utf8 ;
mysql> SET character_set_connection = utf8 ;
mysql> SET character_set_database = utf8 ;
mysql> SET character_set_results = utf8 ;
mysql> SET character_set_server = utf8 ;
mysql> SET collation_connection = utf8 ;
mysql> SET collation_database = utf8 ;
mysql> SET collation_server = utf8 ;
SET character_set_client = utf8;
SET character_set_results = utf8;
SET character_set_connection = utf8;
charset 和 collation 有多个级别的设置:服务器级、数据库级、表级、列级和连接级.
数据库级别
% 修改数据库的字符集
mysql>use databaseName
mysql>alter database databaseName character set utf-8;
%在创建数据库时指定数据库的字符集
mysql>create database databaseName character set utf-8;
表级别与字段级别
注意前三种均为默认设置,并不代码你的字段最终会使用这个字符集设置。
所以我们建议要用show create table table ; 或show full fields from tableName; 来检查当前表中字段的字符集设置。
tbl_emp CREATE TABLE `tbl_emp` ( `pid` int(11) NOT NULL AUTO_INCREMENT, `username` varchar(50) NOT NULL, `password` varchar(50) DEFAULT NULL, `realname` varchar(100) DEFAULT NULL, `status` int(11) DEFAULT NULL, `rightlevel` int(11) DEFAULT NULL, PRIMARY KEY (`pid`) ) ENGINE=InnoDB AUTO_INCREMENT=2 DEFAULT CHARSET=utf8
Field Type Collation Null Key Default Extra Privileges Comment---------- ------------ --------------- ------ ------ ------- -------------- ------------------------------- -------pid int(11) (NULL) NO PRI (NULL) auto_increment select,insert,update,references username varchar(50) utf8_general_ci NO (NULL) select,insert,update,references password varchar(50) utf8_general_ci YES (NULL) select,insert,update,references realname varchar(100) utf8_general_ci YES (NULL) select,insert,update,references status int(11) (NULL) YES (NULL) select,insert,update,references rightlevel int(11) (NULL) YES (NULL) select,insert,update,references
对于数据库为Latin1,且已有数据,(即字段级为Latin1),在使用php的过程中,
通过 set names latin1 和 iconv("gbk","utf-8",$fieldname) // 难道latin1 兼容了gbk?
另外一种办法,就是导库,再变更数据库的字符集,再导回数据处理。
------ 2016-06-20 23:49
% 修改数据库的字符集
mysql>use databaseName
mysql>alter database databaseName character set utf-8;
%在创建数据库时指定数据库的字符集
mysql>create database databaseName character set utf-8;
- [WEB]PHP的编码 与MySQL5.5的编码 适配
- linux下修改mysql5.5的编码
- Mysql5的字符集编码问题解决
- php web开发的编码规范
- 使php的编码与java的编码保持一致
- php转义 与 编码 的函数
- PHP字符串的编码与转义
- PHP的编码问题
- PHP的编码规范
- PHP的编码规范
- mysql5.5编码问题
- centos7下mysql5.6的编码配置
- mysql5.7.16 Windows与Ubuntu的安装、导入数据与编码乱码问题。
- PHP 页面编码声明与用header或meta实现PHP页面编码的区别
- PHP 页面编码声明与用header或meta实现PHP页面编码的区别
- PHP 页面编码声明与用header或meta实现PHP页面编码的区别
- Web容器的编码问题
- Web容器的编码问题
- 丰富程序Notification的使用
- Leetcode_292_Nim Game
- 解决string.len 处理 utf-8 中文字符不正确的问题
- CentOS-7.0.中安装与配置Tomcat-7的方法
- 基于Python的机器学习包 scikit-learn
- [WEB]PHP的编码 与MySQL5.5的编码 适配
- jboss eap 6.3 集群(cluster)配置
- Java数据结构之哈夫曼树
- iOS实现切换摄像头
- MySQL中的数据类型
- 使用ndk编译生成so动态库
- DrawerLayout(侧滑菜单)的使用
- 5-1函数
- Linux下调试工具gdb的使用方法