中文在UTF8和GBK编码中的范围
来源:互联网 发布:淘宝联盟官方发单助手 编辑:程序博客网 时间:2024/04/28 22:40
文章来源:http://www.reai.us/chinese-in-utf8-and-gbk
- 编码范围
1. GBK (GB2312/GB18030)
x00-xff GBK双字节编码范围
x20-x7f ASCII
xa1-xff 中文
x80-xff 中文2. UTF-8 (Unicode)
u4e00-u9fa5 (中文)
x3130-x318F (韩文)
xAC00-xD7A3 (韩文)
u0800-u4e00 (日文)
ps: 韩文是大于[u9fa5]的字符
- 正则例子(使用PHP):
preg_replace(“/([x80-xff])/”,”",$str); //GBK中匹配
preg_replace(“/([u4e00-u9fa5])/”,”",$str); //UTF8中匹配
- 另外一些:
有时候我们也会用到全角英文、特殊符号等
全角英文的UTF8是: uff21 – uff5a ,是从大写A开始到小写的z。
utf8中的 uff20是@
utf8中的 uff01到 uff09是我们美式键盘上shift + 从1到9键上的特殊符号。要注意的是因为@是 uff20,所以 uff02是双引号,同时6的……是两个符号的组合,所以也不存在,正题提前一位(也就是说ff06是&, ff09是))。
utf8中的全角数字是 uff10 – uff19 ,对应关系自然是 0 – 9 。
0 0
- 中文在UTF8和GBK编码中的范围
- utf8中文编码范围
- MySql中UTF8 和 GBK 编码中文字符长度问题
- MySql中UTF8和GBK编码中文字符长度问题
- MySql中UTF8 和 GBK 编码中文字符长度问题
- GBK和UTF8编码处理
- UTF8和GBK编码转换
- UTF8 和GBK编码转换
- 中文在unicode中的编码范围
- 中文在unicode中的编码范围
- Ubuntu文件编码转码(gbk<-->utf8)和中文编码--Ubuntu小笔记
- UTF8和UNICODE和GBK编码
- PHP中GBK和UTF8编码处理
- PHP中GBK和UTF8编码处理
- PHP中GBK和UTF8编码处理
- PHP中GBK和UTF8编码处理
- PHP中GBK和UTF8编码处理
- PHP中GBK和UTF8编码处理
- 第一部分 flask简介《Flask Web开发:基于Python的Web应用开发实战》
- 更改npm全局模块和cache默认安装位置
- wampsever,80端口被Miscrosoft IIS/10.0占用(system pid=4)
- javascript继承
- 748C Santa Claus and Robot
- 中文在UTF8和GBK编码中的范围
- luogu2522[HAOI2011]Problem b
- leg_select2总结
- Java中的24种设计模式与7大原则
- Qt 游戏开发(07) - 为游戏增加音效
- Dirty Flag 模式及其应用
- 【蓝桥杯单片机组】外部中断
- WebStorm2016.1破解
- 代理、网关、隧道、中继