其它基本扩展->URLs

来源:互联网 发布:vb select语句使用方法 编辑:程序博客网 时间:2024/06/04 18:02
其它基本扩展->URLs,这篇想对简单,提供的函数,也是我们大家基本经常会使用到的,我在这里又啰嗦一遍,对于自己是重新总结下:

不说了,直接上相关函数列表:

    urlencode()

        1.编码url字符串。除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+)。
        2.此编码与WWW表单POST数据的编码方式是一样的,同时与application/x-www-form-urlencoded的媒体类型编码方式一样 - 这两个还是需要了解下的:1.我们平常post表单提交就是这种编码;2.header头出现 'application/x-www-form-urlencoded',表示url应该采用了这种编码方式
        3.手册中有一个注释,大家可以了解下:
            由于url的请求字符串中,以 '&' 来分割参数。如果出现的参数组合 '&amp'、'&copy'(当然我们不可能这样,我们一般的命名是:&name=x。但真上升到学术角度,或者严谨角度,是应该重视这个问题,这也算个设计的bug),我们知道浏览器的实体(&xxx;格式),例如:'&'、'©',很明显,2者非常近似。。。而浏览器就会将 '&amp' 给解析为实体,从而将整个 '&amp' 解析为 '&',我们的变量名没了。。。
            正因为上面这个原因,W3C建议,我们将参数分割符改为 ';'。但大多数用户代理并不发送分号分隔符个是的表单数据(也就是说想改为';'来统一这种形式,基本不可能)
            PHP可以通过 'arg_separator.ini' 指令,允许我们修改 'url参数分割符'(这个我们应该可以在自己的服务器使用,但是和大流另类,不现实)
            针对这个细节问题,另一个解决办法:将 '&' 提前转换为 '&' 实体。我就不写了,直接引用手册对实例:
            <?php                $query_string = 'foo=' . urlencode($foo) . '&bar=' . urlencode($bar);                echo '<a href="mycgi?' . htmlentities($query_string) . '">';            ?>

    urldecode() - 解码编码过的url字符串

        1.警告:
            超全局变量 $_GET 和 $_REQUEST 已经被解码了(其它的全局变量并为被解码?例如:$_POST??未测试),我们手动对 $_GET 或 $_REQUEST 里的元素使用 urldecode() 将会导致不可预计和危险的结果。

    rawurlencode()

        1.同urlencode()的唯一区别,就是:将 ' ',转变为 '%20'。(按照 'RFC 3986' 对URL进行编码)
        2.现在多了第2个区别了:在php5.3.4以后,rawurlencode()使用了 'EBCDIC',不会对 '~' 进行编码

    rawurldecode() - 解码编码过的url字符串

    http_build_query(mixed $query_data[, string $numeric_prefix[, string $arg_separator[, int $enc_type = PHP_QUERY_RFC1738]]])

        生成经过URL-encode之后的请求字符串。
        1.$query_data - 可以是数组或包含属性的对象(太勉强了,为何要使用class,大家知道有这个东西就行)
            数组,可以是一维数组,也可以是多维数组。
            实例:
                $data = array('name'=>'dongxuemin', 'age'=>20);                http_build_query($data);     // name=dongxuemin&age=20

            对象,只有public的属性值才会被添加,protected和private属性不添加
            实例:
                class test {                    public $name = 'dongxuemin';                    protected $age = 20;                    private $sex = 'nan';                }                $data = new test();                http_build_query($data);     // name=dongxuemin

        2.$numeric_prefix
            如果在基础数组中使用了数字下标同时给出了该参数,此参数值将会作为基础数组中的数字下标元素的前缀(url中的参数名,写成数字始终不太合规范,我们可以使用该参数,给数字前添加一个字符串前缀)
            实例:
                $data = array('dongxuemin', 20, 'nan');                http_build_query($data);    // 0=dongxuemin&1=20                // ------------------------------------------------                http_build_query($data, 'param_');    // param_0=dongxuemin¶m_1=20

        3.$arg_separator
            参数分割符默认使用 'arg_separator.output' 来分割,我们可以改变php.ini中的配置
        4.enc_type
            5.4.0后,开始有该参数。默认使用 'PHP_QUERY_RFC1738' 编码规范
            PHP_QUERY_RFC1738,编码以 'RFC 1738' 标准和 'application/x-www-form-urlencoded' 媒体类型进行编码,空格将会被编码成 '+'。
            PHP_QUERY_RFC3986,以 'RFC 3986' 标准编码,空格将会被编码为 '%20'(rawurlencode()提到的'~',也不会被编码)

    parse_url(string $url[, int $component = -1])

        解析URL并返回一个关联数组,包含在URL中出现的各种组成部分。(并不是用来验证给定的URL的合法性,只用于分解。即使是不完整的URL也可以,它会尝试尽量正确的解析)
        解析为以下下标:scheme, host, port, user, pass, path, query, fragment
        实例:
            $url = http://username:password@hostname/path?arg=value#anchor            print_r(parse_url($url));        输出:            Array            (                [scheme] => http                [host] => hostname                [user] => username                [pass] => password                [path] => /path                [query] => arg=value                [fragment] => anchor            )

        注意:
            为了存从PHP向后兼容,对于 file:// 协议允许3个斜线:file:///...,其它任何协议都不可以。
        实例:
            $url = 'file://usr/local/a.php';            print_r(parse_url($url));            输出:            Array            (                [scheme] => file                [host] => usr                [path] => /local/a.php            )

            // ---------------------------------
            $url = 'file:///usr/local/a.php';            print_r(parse_url($url));            输出:            Array            (                [scheme] => file                [path] => /usr/local/a.php            )

        2个有点微妙的区别啊:正常访问这2个,可能是相同的,但是parse_url()解析后的结果是不同的。URL的定义:可能是以协议后的第一个 '/' 开始,作为请求的 'path',所以这里才会出现这个结果。


    get_headers(string $url[, int $format = 0])
        返回一个数组,包含服务器响应的一个HTTP请求所发送的标头(返回响应头,就类似我们新打开的一个页面,得到的响应头部,不过这里是通过在我们当前调用get_headers()方法的页面,去请求了下网址,然后我们来分析请求头)
        貌似好像还有点用。。。这个方法是挺简单,虽然我对CUrl不太了解,但是这些东西应该都可以模拟到,只是这个方法很简单!


    get_meta_tags(string $filename[, bool $use_include_path = false])
        从文件中提取所有的meta标签的content属性,返回一个数组。
        打开指定的文件,逐行解析文件中的 <meta> 标签,直到 </head> 处停止。
        注意:
            只有具有 'name' 属性的 <meta>,才会被解析
            我们知道html的<meta>有2种:
                <meta name="" content="" />         // 把content属性关联到一个名称(author, description, keywords, generator等)
                <meta http-equiv="" content="" />   // 把content属性关联到HTTP头部
                    使用带有 http-equiv 属性的 <meta> 标签时,服务器将把名称/值对添加到发送给浏览器的内容头部。例如,添加:
                        <meta http-equiv="charset" content="iso-8859-1">
                        <meta http-equiv="expires" content="31 Dec 2008">
                    响应头就会添加上:
                        charset:iso-8859-1
                        expires:31 Dec 2008
        1.$filename
            解析的文件,可以是本地文件,也可以是一个URL
        2.$use_include_path
            设置为true,php尝试按照 'include_path' 配置去查找文件,只针对本地文件
        3.返回值
            返回的关联数组,<meta> 的name属性作为键,content属性作为值。属性 name 中的特殊字符将使用‘_’替换,而其它字符则转换成小写。如果有两个 meta 标签拥有相同的 name,则只返回最后出现的那一个。


    base64_encode()     // 使用 MIME base64 对数据进行编码
    base64_decode()     // 解码
    这2个函数相关详解,单独写到另一篇博客中:
    其它基本扩展->URLs->base64加密





0 0
原创粉丝点击