UTF编码字符串的总字节数计算
来源:互联网 发布:推荐les淘宝店 编辑:程序博客网 时间:2024/05/18 00:38
首先是在UTF-8编码下
占2个字节的:〇
占3个字节的:基本等同于GBK,含21000多个汉字
占4个字节的:中日韩超大字符集里面的汉字,有5万多个
一个utf8数字占1个字节
一个utf8英文字母占1个字节
来自
UTF-8的编码结构长度是根据某单个字符的大小
来决定长度有多少。
下面为单个字符的大小占用几个字节。单个unicode字符编码之后的最大长度为6个字节。
- 1个字节:Unicode码为0 - 127
- 2个字节:Unicode码为128 - 2047
- 3个字节:Unicode码为2048 - 0xFFFF
- 4个字节:Unicode码为65536 - 0x1FFFFF
- 5个字节:Unicode码为0x200000 - 0x3FFFFFF
- 6个字节:Unicode码为0x4000000 - 0x7FFFFFFF
JS:
var str="zhong中国1234"; var byteSize = 0; for (var i = 0; i < str.length; i++) { var charCode = str.charCodeAt(i); if (0 <= charCode && charCode <= 0x7f) { byteSize += 1; } else if (128 <= charCode && charCode <= 0x7ff) { byteSize += 2; } else if (2048 <= charCode && charCode <= 0xffff) { byteSize += 3; } else if (65536 < charCode && code <= 0x1FFFFF) { byteSize += 4; } else if (0x200000 < charCode && charCode <= 0x3FFFFFF) { byteSize += 5; } else if (0x4000000 < charCode && charCode <= 0x7FFFFFFF) { byteSize += 6; } } console.log('byteSize',byteSize);
‘〇’字符可以特判!
1 0
- UTF编码字符串的总字节数计算
- 计算字符串的字节数
- Buffer.byteLength(字符串,编码方式)计算指定字符串的字节数
- js 计算字符串的字节数
- JS计算字符串的字节数
- JS计算字符串的字节数
- 计算 UTF-8 字符串长度(忽略字节的方案)
- js 计算字符串字节数
- js 计算 字符串 字节数
- 计算字符串占用字节数
- 引入android工程总提示有错,某些变量找不到,可以尝试将工程的字节编码修改成UTF-8
- 三种常见的编码:ASCII码、UTF-8编码、Unicode编码等字符占据的字节数
- Java中utf-8编码方式时所占字节数的计算方法封装
- PHP中不同编码的汉字占的字节数不同gbk,GBK,UTF-8,utf-8
- PHP中不同编码的汉字占的字节数不同gbk,GBK,UTF-8,utf-8
- 按 字节截取分别以GBK 和 utf-8 编码的 字符串的java程序。
- Java字符串 字节数计算 截取长度
- 用JavaScript计算字符串占用字节数
- 剑指offer面试题14
- SpringMVC参数绑定注解
- Android工具类
- 链表增删查
- jQuery Mobile Data 属性
- UTF编码字符串的总字节数计算
- Android 联系人数据库contacts2.db介绍
- 406. Queue Reconstruction by Height
- /bin/bash: bison: command not found
- 你真的了解 load 方法么
- hdu 2203
- Android-AutoCompleteTextView
- iOS urlencoded 转码解码
- effective c++-让自己习惯c++