其它基本扩展->URLs

来源：互联网发布：vb select语句使用方法编辑：程序博客网时间：2024/06/04 18:02

其它基本扩展->URLs，这篇想对简单，提供的函数，也是我们大家基本经常会使用到的，我在这里又啰嗦一遍，对于自己是重新总结下：

不说了，直接上相关函数列表：

urlencode()

1.编码url字符串。除了 -_. 之外的所有非字母数字字符都将被替换成百分号（%）后跟两位十六进制数，空格则编码为加号（+）。
2.此编码与WWW表单POST数据的编码方式是一样的，同时与application/x-www-form-urlencoded的媒体类型编码方式一样－这两个还是需要了解下的：1.我们平常post表单提交就是这种编码；2.header头出现 'application/x-www-form-urlencoded'，表示url应该采用了这种编码方式
3.手册中有一个注释，大家可以了解下：
由于url的请求字符串中，以 '&' 来分割参数。如果出现的参数组合 '&amp'、'&copy'（当然我们不可能这样，我们一般的命名是：&name=x。但真上升到学术角度，或者严谨角度，是应该重视这个问题，这也算个设计的bug），我们知道浏览器的实体（&xxx;格式），例如：'&'、'©'，很明显，2者非常近似。。。而浏览器就会将 '&amp' 给解析为实体，从而将整个 '&amp' 解析为 '&'，我们的变量名没了。。。
正因为上面这个原因，W3C建议，我们将参数分割符改为 ';'。但大多数用户代理并不发送分号分隔符个是的表单数据(也就是说想改为';'来统一这种形式，基本不可能)
PHP可以通过 'arg_separator.ini' 指令，允许我们修改 'url参数分割符'（这个我们应该可以在自己的服务器使用，但是和大流另类，不现实）
针对这个细节问题，另一个解决办法：将 '&' 提前转换为 '&' 实体。我就不写了，直接引用手册对实例：

            <?php                $query_string = 'foo=' . urlencode($foo) . '&bar=' . urlencode($bar);                echo '<a href="mycgi?' . htmlentities($query_string) . '">';            ?>

urldecode() - 解码编码过的url字符串

1.警告：
超全局变量 $_GET 和 $_REQUEST 已经被解码了（其它的全局变量并为被解码？例如：$_POST？？未测试），我们手动对 $_GET 或 $_REQUEST 里的元素使用 urldecode() 将会导致不可预计和危险的结果。

rawurlencode()

1.同urlencode()的唯一区别，就是：将 ' '，转变为 '%20'。（按照 'RFC 3986' 对URL进行编码）
2.现在多了第2个区别了：在php5.3.4以后，rawurlencode()使用了 'EBCDIC'，不会对 '~' 进行编码

rawurldecode() - 解码编码过的url字符串

http_build_query(mixed $query_data[, string $numeric_prefix[, string $arg_separator[, int $enc_type = PHP_QUERY_RFC1738]]])

生成经过URL-encode之后的请求字符串。
1.$query_data - 可以是数组或包含属性的对象(太勉强了，为何要使用class，大家知道有这个东西就行)
数组，可以是一维数组，也可以是多维数组。
实例：

                $data = array('name'=>'dongxuemin', 'age'=>20);                http_build_query($data);     // name=dongxuemin&age=20

对象，只有public的属性值才会被添加，protected和private属性不添加
实例：

                class test {                    public $name = 'dongxuemin';                    protected $age = 20;                    private $sex = 'nan';                }                $data = new test();                http_build_query($data);     // name=dongxuemin

2.$numeric_prefix
如果在基础数组中使用了数字下标同时给出了该参数，此参数值将会作为基础数组中的数字下标元素的前缀(url中的参数名，写成数字始终不太合规范，我们可以使用该参数，给数字前添加一个字符串前缀)
实例：

                $data = array('dongxuemin', 20, 'nan');                http_build_query($data);    // 0=dongxuemin&1=20                // ------------------------------------------------                http_build_query($data, 'param_');    // param_0=dongxuemin¶m_1=20

3.$arg_separator
参数分割符默认使用 'arg_separator.output' 来分割，我们可以改变php.ini中的配置
4.enc_type
5.4.0后，开始有该参数。默认使用 'PHP_QUERY_RFC1738' 编码规范
PHP_QUERY_RFC1738，编码以 'RFC 1738' 标准和 'application/x-www-form-urlencoded' 媒体类型进行编码，空格将会被编码成 '+'。
PHP_QUERY_RFC3986，以 'RFC 3986' 标准编码，空格将会被编码为 '%20'(rawurlencode()提到的'~'，也不会被编码)

parse_url(string $url[, int $component = -1])

解析URL并返回一个关联数组，包含在URL中出现的各种组成部分。（并不是用来验证给定的URL的合法性，只用于分解。即使是不完整的URL也可以，它会尝试尽量正确的解析）
解析为以下下标：scheme, host, port, user, pass, path, query, fragment
实例：

            $url = http://username:password@hostname/path?arg=value#anchor            print_r(parse_url($url));        输出：            Array            (                [scheme] => http                [host] => hostname                [user] => username                [pass] => password                [path] => /path                [query] => arg=value                [fragment] => anchor            )

注意：
为了存从PHP向后兼容，对于 file:// 协议允许3个斜线：file:///...，其它任何协议都不可以。
实例：

            $url = 'file://usr/local/a.php';            print_r(parse_url($url));            输出：            Array            (                [scheme] => file                [host] => usr                [path] => /local/a.php            )

// ---------------------------------

            $url = 'file:///usr/local/a.php';            print_r(parse_url($url));            输出：            Array            (                [scheme] => file                [path] => /usr/local/a.php            )

2个有点微妙的区别啊：正常访问这2个，可能是相同的，但是parse_url()解析后的结果是不同的。URL的定义：可能是以协议后的第一个 '/' 开始，作为请求的 'path'，所以这里才会出现这个结果。

get_headers(string $url[, int $format = 0])
返回一个数组，包含服务器响应的一个HTTP请求所发送的标头(返回响应头，就类似我们新打开的一个页面，得到的响应头部，不过这里是通过在我们当前调用get_headers()方法的页面，去请求了下网址，然后我们来分析请求头)
貌似好像还有点用。。。这个方法是挺简单，虽然我对CUrl不太了解，但是这些东西应该都可以模拟到，只是这个方法很简单！

get_meta_tags(string $filename[, bool $use_include_path = false])
从文件中提取所有的meta标签的content属性，返回一个数组。
打开指定的文件，逐行解析文件中的 <meta> 标签，直到 </head> 处停止。
注意：
只有具有 'name' 属性的 <meta>，才会被解析
我们知道html的<meta>有2种：
<meta name="" content="" /> // 把content属性关联到一个名称(author, description, keywords, generator等)
<meta http-equiv="" content="" /> // 把content属性关联到HTTP头部
使用带有 http-equiv 属性的 <meta> 标签时，服务器将把名称/值对添加到发送给浏览器的内容头部。例如，添加：
<meta http-equiv="charset" content="iso-8859-1">
<meta http-equiv="expires" content="31 Dec 2008">
响应头就会添加上：
charset:iso-8859-1
expires:31 Dec 2008
1.$filename
解析的文件，可以是本地文件，也可以是一个URL
2.$use_include_path
设置为true，php尝试按照 'include_path' 配置去查找文件，只针对本地文件
3.返回值
返回的关联数组，<meta> 的name属性作为键，content属性作为值。属性 name 中的特殊字符将使用‘_’替换，而其它字符则转换成小写。如果有两个 meta 标签拥有相同的 name，则只返回最后出现的那一个。

base64_encode() // 使用 MIME base64 对数据进行编码
base64_decode() // 解码
这2个函数相关详解，单独写到另一篇博客中：
其它基本扩展->URLs->base64加密

0 0