UrlEncoder和UrlDecoder

来源:互联网 发布:淘宝怎么买医疗器械 编辑:程序博客网 时间:2024/06/07 01:23

前言:

我们经常会看见这样的网址  www.abc.com/%E4%BD%A0  ,你一定会好奇,%E4%BD%A0是什么呢?为什么是这种格式?这是浏览器对网址进行了编码,在java中也存在这么一个类就是UrlEncoder。


转换规则:


HTML 格式编码的实用工具类。该类包含了将 String 转换为 application/x-www-form-urlencoded MIME 格式的静态方法。有关 HTML 格式编码的更多信息,请参阅 HTML 规范。对 String 编码时,使用以下规则:字母数字字符 "a" 到 "z"、"A" 到 "Z" 和 "0" 到 "9" 保持不变。特殊字符 "."、"-"、"*" 和 "_" 保持不变。空格字符 " " 转换为一个加号 "+"。所有其他字符都是不安全的,因此首先使用一些编码机制将它们转换为一个或多个字节。然后每个字节用一个包含 3 个字符的字符串 "%xy" 表示,其中 xy 为该字节的两位十六进制表示形式。推荐的编码机制是 UTF-8。但是,出于兼容性考虑,如果未指定一种编码,则使用相应平台的默认编码。例如,使用 UTF-8 编码机制,字符串 "The string ü@foo-bar" 将转换为 "The+string+%C3%BC%40foo-bar",因为在 UTF-8 中,字符 ü 编码为两个字节,C3 (十六进制)和 BC (十六进制),字符 @ 编码为一个字节 40 (十六进制)。



转换规则总结:

1、数字、英语字母、特殊字符不进行转换

2、空格转为+号

3、其他字符,用某种编码(比如utf8)转化为一个(或多个)字节,每个字节对应一个 %xy,xy是十六进制


总结:

1、之前我混淆了unicode(\uxxxx)与urlencoder编码后的%xy地址,现在明白了。

2、了解了urlencoder的转换规则,看到%%%%%字样的地址,也就不再怕了。



0 0