URL Rewrite Rule重写规则

来源:互联网 发布:淘宝天机平台 编辑:程序博客网 时间:2024/05/13 19:05

php URL rewrite路径重写一例

一、文件 test.php
 复制代码 代码示例:

<?php$id=$_GET["id"];echo $id;?>
首先 apache文件里
打开Apache配置文件httpd.conf,找到如下:#LoadModule rewrite_module modules/mod_rewrite.so
开启rewrite,去点前面"#"

二、重载Allowoverride
查找apache配置文件找到如下:
复制代码 代码示例:
<Directory />     Options FollowSymLinks     AllowOverride None </Directory>
将AllowOverride None 改为 AllowOverride All
在htaccess中暂时了解到三种url重定义
复制代码 代码示例:
<IFMODULE mod_rewrite.c>RewriteEngine On#RewriteBase /  (若文件在根目录下不必定义)#RewriteRule ^t_(.*).html$ test.php?id=$1 [NC](打开test.php以t_id.html  比如 t_2.html  页面输出 id=2)RewriteRule ^([0-9]+)$ test.php?id=$1 [NC](直接输入id  比如 localhost/test/2  页面输出 id=2)RewriteRule ^index.html$ index.php [NC](直接输入index.html可打开index.php这个页面)</IFMODULE>

php 伪静态(url重写)的写法

PHP 伪静态,也称作php URL重写,无论是出于seo优化的考虑,还是想让url更美观,都是现在非常流行的方法,建议大家学习参考下。
来看下面这个网页 url:
http://www.jbxue.com/test.php/1,100,8630.html
其实处理的脚本是test.php 参数为1,100,8630
相当于test.php?a=1&b=1=100&c=8630 只不过这样的URL太难记。搜索引擎也不喜欢。
真静态只是完全生成了HTML。
客户端访问的时候直接输出。不用脚本解释。可以节省不少带宽哦。
当网站浏览不是很大时,可以考虑url重写,即不生成真正的静态页面。
为大家提供一个简单的url重写的php代码,方便初学的朋友参考。
有兴趣的朋友,还可以研究下这篇文章:php实现简单的伪静态URL的机制介绍

<?php// url http://www.jbxue.com/test.php/1,100,8630.html//利用server变量 取得PATH_INFO信息 该例中为 /1,100,8630.html 也就是执行脚本名后面的部分if(@$path_info =$_SERVER["PATH_INFO"]){//正则匹配一下参数if(preg_match("/\/(\d+),(\d+),(\d+)\.html/si",$path_info,$arr_path)){$gid =intval($arr_path[1]); //取得值 1$sid =intval($arr_path[2]); //取得值100$softid =intval($arr_path[3]); //取得值8630}else die("Path:Error!");//相当于test.php?gid=1&sid=100&softid=8630}else die('Path:Nothing!');?>

php实现简单的伪静态URL的机制介绍

php框架路由伪静态
曾几何时,我们公司准备开发一套新的建站系统,决定将以前的框架给KO掉,重新开发一套新的框架来适应新的系统功能。领导们不希望使用外面已有的框架,号称要开发有自己特色的框架(不懂开发的领导害死人)。于是我们又投入到了新的开发当中。
由于我们的系统支持伪静态,以前的系统是直接使用服务器apache或IIS自带的rewrite文件定义规则,而框架中没有任何路由机制,于是这次框架准备使用新的策略,由PHP实现路由机制。于是我开始了功能实现的探索之路。
开发之前,我先了解‘路由机制’要做什么,它主要做两件事。
1.路由机制就是把某一个特定形式的URL结构中提炼出来系统对应的参数。举个例子,如:http://main.wopop.com/article/1  其中:/article/1  -> ?_m=article&id=1。
2.其次,是将拥有对应参数的URL转换成特定形式的URL结构,是上面的过程的逆向过程。由于路由机制隔离了URL结构和参数的转换关系,使的日后结构的变化不会影响下面代码的执行。
通过上面的了解,可以得出要编写一个路由机制要一下几步:
1.编写服务器apache或IIS自带的rewrite文件,将URL结构导入index.php。
2.一个路由规则配置文件。
3.一个路由解析器,用来解析规则,匹配和转换URL。
于是,我们一一实现其中的每一个部分。
1.rewrite文件编写,以Apache为例:
复制代码 代码如下:

<IfModule mod_rewrite.c>  RewriteEngine On  RewriteRule ^index\.php$ - [L]  RewriteCond %{REQUEST_FILENAME} !-f  RewriteCond %{REQUEST_FILENAME} !-d  RewriteRule (.+) index.php/$1 [L]  </IfModule> 上面的代码就是将URL结构导入index.php中,具体的rewrite细节就不赘述了。2.在PHP中设置一个路由规则配置文件routes.php,我简单的使用了一个hash数组编写规则:复制代码 代码如下:    /**      *路由配置文件编写说明:      * 路由配置在一个array数组中,一条记录代表一个规则      * 其中数组key的数据代表匹配的路径格式:使用特定的字符串标识  如:'/{id}'      * 字符串中可以包含特定的变量,所有变量使用大括号{}包裹起来      * 数组value里是一个array数组,是对key中路径中变量进行特定处理      * 变量写在数组的key中,规范写在数组的value里,如:array('id'=>'/\d+/','_m'=>'frontpage','_a'=>'index')      * 规范分成两类:      * 1.格式判断:比如 '/{id}'=> array('id'=>'/\d+/','_m'=>'frontpage','_a'=>'index') 为例,其中'id'=>'/\d+/'就是一个格式判断,      * 表示id变量只能是数字,格式判断后面只能使用正则表达式,由于PHP没有正则类,所以我指定 '/XXX/'和'#XXX#'格式的字符串为正则表达式      * 2.默认参数:比如 '/{id}'=> array('id'=>'/\d+/','_m'=>'frontpage','_a'=>'index') 为例,其中'_m'=>'frontpage'就是一个默认参数,      * 因为前面的路径没有_m和_a信息,所以后面会使用默认参数作为_m和_a的值      *       * 所以对于规则'/{id}'=> array('id'=>'/\d+/','_m'=>'frontpage','_a'=>'index')。我传入 /3  系统会转换成 index.php?_m=frontpage&_a=index&id=3      *       * 规则匹配是按照$routes数组的顺序逐一匹配,一旦匹配上了就不往下匹配了。所以一些特定的匹配规则要放在前面,通用的放在后面。      * 否则可能导致不执行特定的匹配规则了      */      $routes= array(          '/' => array('_m'=>'wp_frontpage','_a'=>'index'),          '/{id}'=> array('id'=>'/\d+/','_m'=>'wp_frontpage','_a'=>'index'),          '/{_m}/{_a}/{id}'=> array('id'=>'/\d+/'),          '/{_m}/{_a}'=> array()      ); 

3.路由机制中最复杂也是最重要的一部分,就是解析器。
解析器有两个类组成(名字可能起的不佳)。
一个是Route,作为整个解析器对外的接口,用于解析规则,匹配和转换URL,然而它只是一个代理,实际操作不是直接由它直接做的。
一个是RoutePattern,每个RoutePattern实例对应规则数组中的一条记录,一个Route实例包含多个RoutePattern,而Route中的所有操作都会调用内部所有RoutePattern实例操作,并进行整合。
复制代码 代码如下:

class Route      {          private static $instance = null;          private $routepatterns=array();                    private function __construct()          {              $routes = array();               include ROOT."/routes.php";               foreach($routes as $key=>$value){                   $this->routepatterns[]=new RoutePattern($key,$value);               }                              if(!isset($_SERVER['PATH_INFO'])) return false;               $urlpath= $_SERVER['PATH_INFO'];               $ismatch=$this->match_url($urlpath);               $strip_urlpath=str_replace('/','',$urlpath);               if(!$ismatch&&!emptyempty($strip_urlpath)){                   Content::redirect(PAGE_404);               }          }          /**          * 用路由规则匹配对应的url地址,匹配成功将对应url参数放入$_GET中          * @param  string url地址          * @return bool 是否匹配成功          */          public function match_url($urlpath){              foreach($this->routepatterns as $router){                  $urlargs=$router->match_url($urlpath);                  if($urlargs!==false){                      $_GET=array_merge($urlargs,$_GET);                      return true;                  }              }              return false;          }                    public function rewrite_url($urlparams){              foreach($this->routepatterns as $router){                  $urlstr=$router->rewrite_url($urlparams);                  if($urlstr!==false){                      return $urlstr;                  }              }              $actualparams=array();              foreach($urlparams as $arg=>$val){                  $actualparams[]=$arg."=".urlencode($val);              }              $actualparamstr=implode('&', $actualparams);              $rewriteurl="/index.php";              if(!emptyempty($rewriteurl))$rewriteurl.="?{$actualparamstr}";              return $rewriteurl;          }                    public static function init()          {              if (null == self::$instance) {                  self::$instance = new Route();              }              return self::$instance;          }      }            class RoutePattern{      //......      } 
关于路由配置文件的解析,主要细节全在类RoutePattern中,关于RoutePattern中对规则的解析、URL匹配和转换URL细节,篇幅和精力有限,今天就不详细介绍了,下回再仔细分析。

RewriteRule重写规则的语法

RewriteRule
Syntax: RewriteRule Pattern Substitution [flags] 
一条RewriteRule指令,定义一条重写规则,规则间的顺序非常重要。

对Apache1.2及以后的版本,模板(pattern)是一个 POSIX正则式,用以匹配当前的URL。当前的URL不一定是用记最初提交的URL,因为可能用一些规则在此规则前已经对URL进行了处理。  Apache的Mod_rewrite学习(RewriteRule重写规则的语法) - dawnsword - 理想与现实
对mod_rewrite来说,!是个合法的模板前缀,表示“非”的意思,这对描述“不满足某种匹配条件”的情况非常方便,或用作最后一条默认规则。当使用!时,不能在模板中有分组的通配符,也不能做后向引用。
当匹配成功后,Substitution会被用来替换相应的匹配,它除了可以是普通的字符串以外,还可以包括: 
1. $N,引用RewriteRule模板中匹配的相关字串,N表示序号,N=0..9 
2. %N,引用最后一个RewriteCond模板中匹配的数据,N表示序号 
3. %{VARNAME},服务器变量 
4. ${mapname:key|default},映射函数调用
这些特殊内容的扩展,按上述顺序进行。
一个URL的全部相关部分都会被Substitution替换,而且这个替换过程会一直持续到所有的规则都被执行完,除非明确地用L标志中断处理过程。
当susbstitution有”-”前缀时,表示不进行替换,只做匹配检查。
利用RewriteRule,可定义含有请求串(Query String)的URL,此时只需在Sustitution中加入一个?,表示此后的内容放入QUERY_STRING变量中。如果要清空一个 QUERY_STRING变量,只需要以?结束Substitution串即可。
如果给一个Substitution增加一个http://thishost[:port]的前缀,则mod_rewrite会自动将此前缀去掉。因此,利用http://thisthost做一个无条件的重定向到自己,将难以奏效。要实现这种效果,必须使用R标志。
Flags是可选参数,当有多个标志同时出现时,彼此间以逗号分隔。
1. 'redirect|R [=code]' (强制重定向)
给当前的URI增加前缀http://thishost[:thisport]/, 从而生成一个新的URL,强制生成一个外部重定向(external redirection,指生的URL发送到客户端,由客户端再次以新的URL发出请求,虽然新URL仍指向当前的服务器). 如果没有指定的code值,则HTTP应答以状态值302 (MOVED TEMPORARILY),如果想使用300-400(不含400)间的其它值可以通过在code的位置以相应的数字指定,也可以用标志名指定: temp (默认值), permanent, seeother.
注意,当使用这个标志时,要确实substitution是个合法的URL,这个标志只是在URL前增加http://thishost[:thisport]/前缀而已,重写操作会继续进行。如果要立即将新URL重定向,用L标志来中重写流程。 
2. 'forbidden|F' (强制禁止访问URL所指的资源)
立即返回状态值403 (FORBIDDEN)的应答包。将这个标志与合适的RewriteConds 联合使用,可以阻断访问某些URL。 
3. 'gone|G' (强制返回URL所指资源为不存在(gone))
立即返回状态值410 (GONE)的应答包。用这个标志来标记URL所指的资源永久消失了. 
4. # 'proxy|P' (强制将当前URL送往代理模块(proxy module))
这个标志,强制将substitution当作一个发向代理模块的请求,并立即将共送往代理模块。因此,必须确保substitution串是一个合法的URI (如, 典型的情况是以http://hostname开头),否则会从代理模块得到一个错误. 这个标志,是ProxyPass指令的一个更强劲的实现,将远程请求(remote stuff)映射到本地服务器的名字空间(namespace)中来。
注意,使用这个功能必须确保代理模块已经编译到Apache 服务器程序中了. 可以用“httpd -l ”命令,来检查输出中是否含有mod_proxy.c来确认一下。如果没有,而又需要使用这个功能,则需要重新编译``httpd''程序并使用 mod_proxy有效。 
5. 'last|L' (最后一条规则)
中止重写流程,不再对当前URL施加更多的重写规则。这相当于perl的last命令或C的break命令。
6. 'next|N' (下一轮)
重新从第一条重写规则开始执行重写过程,新开的过程中的URL不应当与最初的URL相同。 这相当于Perl的next命令或C的continue命令. 千万小心不要产生死循环。 
7. # 'chain|C' (将当前的规则与其后续规则綑绑(chained))
当规则匹配时,处理过程与没有綑绑一样;如果规则不匹配,则綑绑在一起的后续规则也不在检查和执行。 
8. 'type|T=MIME-type' (强制MIME类型)
强制将目标文件的MIME-type为某MIME类型。例如,这可用来模仿mod_alias模块对某目录的ScriptAlias指定,通过强制将该目录下的所有文件的类型改为 “application/x-httpd-cgi”. 
9. 'nosubreq|NS' (used only if no internal sub-request )
这个标志强制重写引擎跳过为内部sub-request的重写规则.例如,当mod_include试图找到某一目录下的默认文件时 (index.xxx),sub-requests 会在Apache内部发生. Sub-requests并非总是有用的,在某些情况下如果整个规则集施加到它上面,会产生错误。利用这个标志可排除执行一些规则。 
10. 'nocase|NC' (模板不区分大小写)
这个标志会使得模板匹配当前URL时忽略大小写的差别。 
11. 'qsappend|QSA' (追加请求串(query string))
这个标志,强制重写引擎为Substitution的请求串追加一部分串,则不是替换掉原来的。借助这个标志,可以使用一个重写规则给请求串增加更多的数据。 
12. 'noescape|NE' (不对输出结果中的特殊字符进行转义处理)
通常情况下,mod_write的输出结果中,特殊字符(如'%', '$', ';', 等)会转义为它们的16进制形式(如分别为'%25', '%24', and '%3B')。这个标志会禁止mod_rewrite对输出结果进行此类操作。 这个标志只能在 Apache 1.3.20及以后的版本中使用。 
13. 'passthrough|PT' (通过下一个处理器)
这个标志强制重写引擎用 filename字段的值来替换内部request_rec数据结构中uri字段的值。. 使用这个标志,可以使后续的其它URI-to-filename转换器的Alias、ScriptAlias、Redirect等指令,也能正常处理 RewriteRule指令的输出结果。用一个小例子来说明它的语义:如果要用mod_rewrite的重写引擎将/abc转换为/def,然后用 mod_alas将/def重写为ghi,则要:
RewriteRule ^/abc(.*) /def$1 [PT]
Alias /def /ghi
如 果PT标志被忽略,则mod_rewrite也能很好完成工作,如果., 将 uri=/abc/... 转换为filename=/def/... ,完全符合一个URI-to-filename转换器的动作。接下来 mod_alias 试图做 URI-to-filename 转换时就会出问题。
注意:如果要混合都含有URL-to-filename转换器的不同的模块的指令,必须用这个标志。最典型的例子是mod_alias和mod_rewrite的使用。 
14. 'skip|S=num' (跳过后面的num个规则)
当前规则匹配时,强制重写引擎跳过后续的num个规则。用这个可以来模仿if-then-else结构:then子句的最后一条rule的标志是skip=N,而N是else子句的规则条数。 
15. 'env|E=VAR:VAL' (设置环境变量)
设置名为VAR的环境变量的值为VAL,其中VAL中可以含有正则式的后向引用($N或%N)。这个标志可以使用多次,以设置多个环境变量。这儿设置的 变量,可以在多种情况下被引用,如在XSSI或CGI中。另外,也可以在RewriteCond模板中以%{ENV:VAR}的形式被引用。 
16.
注意:一定不要忘记,在服务器范围内的配置文件中,模板(pattern)用以匹配整个URL;而在目录范围内的配置文件中,目录前缀总是被自动去 掉后再进行模板匹配的,且在替换完成后自动再加上这个前缀。这个功能对很多种类的重写是非常重要的,因为如果没有去前缀,则要进行父目录的匹配,而父目录 的信息并不是总能得到的。一个例外是,当substitution中有http://打头时,则不再自动增加前缀了,如果P标志出现,则会强制转向代理。
注 意:如果要在某个目录范围内启动重写引擎,则需要在相应的目录配置文件中设置“RewriteEngine on”,且目录的“Options FollowSymLinks”必须设置。如果管理员由于安全原因没有打开FollowSymLinks,则不能使用重写引擎。
--------------------------------------------------------------------------------------------
Apache - 模块 - mod_rewrite - RewriteCond - 通过检查HTTP_REFERER避免静态图片盗链对性能有严重影响

Apache 重写规则的常见应用 (rewrite) 

一:目的

本文旨在提供如何用Apache重写规则来解决一些常见的URL重写方法的问题,通过常见的实例给用户一些使用重写规则的基本方法和线索。
二:为什么需要用重写规则? 
一个网站,如果是长期需要放在internet上提供服务,必定会有不断地更新和维护,如临时转移到其它服务器进行维护,重新组织目录结构,变换URL甚至改变到新的域名等等,而为了让客户不会因此受到任何影响,最好的方法就是使用Apache Rewrite Rule(重写 规则)。
三: 重写规则的作用范围 
1) 可以使用在Apache主配置文件httpd.conf中 
2) 可以使用在httpd.conf里定义的虚拟主机配置中 
3) 可以使用在基本目录的跨越配置文件.htaccess中
四:重写规则的应用条件 
只有当用户的WEB请求最终被导向到某台WEB服务器的Apache后台,则这台WEB服务器接受 进来的请求,根据配置文件该请求是主配置还是虚拟主机,再根据用户在浏览器中请求的 URL来配对重写规则并且根据实际的请求路径配对.htaccess中的重写规则。最后把请求的内容传回给用户,该响应可能有两种:
    1) 对浏览器请求内容的外部重定向(Redirect)到另一个URL。 
让浏览器再次以新的URI发出请求(R=301或者R=302,临时的或是永久的重定向) 
如:一个网站有正规的URL和别名URL,对别名URL进行重定向到正规URL,或者网站改换成了新的域名则把旧的域名重定向到新的域名(Redirect)
    2) 也可能是由Apache内部子请求代理产生新的内容送回给客户[P,L] 
这是Apache内部根据重写后的URI内部通过代理模块请求内容并送回内容给客户,而客户端浏览器并不知道,浏览器中的URI不会被重写。但实际内容被Apache根据重写规则后的URI得到。 如:在公司防火墙上运行的Apache启动这种代理重写规则,代理对内部网段上的WEB服务器的请求。
五:重写规则怎样工作? 
我们假定在编译Apache时已经把mod_rewrite编译成模块,确信你的httpd.conf中有 
LoadModule rewrite_module libexec/mod_rewrite.so 
并且在Addmodule中有 
Addmodule mod_rewrite.c 
则可以使用重写规则。 
当外部请求来到Apache,Apache调用重写规则中的定义来重写由用户浏览器指定请求的URL,最后被重写的URI如果是重定向,则送由浏览器作再一次请求;如果是代理则把重写 后的URI交给代理模块请求最终的内容(Content),最后把内容送回给浏览器。
六: 何时使用.htaccess中的重写规则定义? 
假如你对你的的网站内容所在的服务器没有管理员权限,或者你的网站放在ISP的服务器上托管等等条件下,你无法改写主配置文件,然而你可以对你的WEB站点内容所在的目录有写权限,则你可以设置自己的.htaccess 文件达到同样的目的。但你需要确定主配置文件中对你的网站所在的目录定义了下面的内容:
Options Indexes FollowSymLinks 
AllowOverride all
否则你的.htaccess不会工作。
七: 应用举例 
假定Apache被编译安装在主机192.168.1.56的/usr/local/apache/ 目录下面,我们编 
译进了重写和代理模块。
      1) 隐藏Apache下的某个目录,使得对该目录的任何请求都重定向到另一个文件。
      a> httpd.conf的实现方法
      我们放下面的部分到/usr/local/apache/conf/httpd.conf

options Indexes followsymlinks allowoverride all rewriteengine on rewritebase / rewriterule ^(.*)$ index.html.en [R=301]
注:rewriteengine on 为重写引擎开关,如果设为off,则任何重写规则定义将不被应用,该开关的另一好处就是如果为了临时拿掉重写规则,则改为off再重启动Apache即可,不必将下面一条条的重写规则注释掉。rewritebase / 的作用是如果在下面的rewriterule定义中被重写后的部分(此处为文件名index.html.en)前面没有/,则是相对目录,相对于这个rewritebase后面的定义也就是/usr/local/apache/htdocs/index.html.en,否则,如果此处没有rewritebase /这 一项,则被重写成 http://192.168.1.56/usr/local/apache/htdocs/manual/index.html.en ,显然是 不正确的。
不过这里我们也可以不用rewritebase / , 而改为 
rewriteengine on 
rewriterule ^(.*)$ /index.html.en [R=301] 
或者 
rewriteengine on 
rewriterule ^(.*)$ http://192.168.1.56/index.html.en [R=301]
      b> .htaccess的实现方法
我们先放下面的部分到httpd.conf
options Indexes followsymlinks 
allowoverride all
然后放下面的部分到/usr/local/apache/htdocs/manual/.htaccess中 
rewriteengine on 
rewritebase / 
rewriterule ^(.*)$ index.html.en [R=301]
注:对文件.htaccess所作的任何改动不需要重启动Apache.
问:要是把这个manual目录重定向到用户jephe的自己的主目录呢? 
用下面的.htaccess方案。 
rewriteengine on 
rewritebase /~jephe/ 
rewriterule ^(.*)$ $1 [R=301]
则对manual目录下任何文件的请求被重定向到~jephe目录下相同文件的请求。
2) 转换www.username.domain.com的对于username的主页请求为 
www.domain.com/username
对于HTTP/1.1的请求包括一个Host: HTTP头,我们能用下面的规则集重写 
http://www.username.domain.com/anypath 到 /home/username/anypath
Rewriteengine on rewritecond %{HTTP_HOST} ^www\.[^.]+\.host\.com$ rewriterule ^(.+) %{HTTP_HOST}$1 [C] rewriterule ^www\.([^.]+)\.host\.com(.*) /home/$1$2
注: rewritecond 条件重写规则,当满足后面定义的条件后才会应用下面的重写规则, rewritecond有各种变量 
,请查阅相关文档。
3) 防火墙上的重写规则代理内部网段上服务器的请求。
 NameVirtualhost 1.2.3.4
servername www.domain.com 
rewriteengine on 
proxyrequest on 
rewriterule ^/(.*)$ http://192.168.1.3/$1 [P,L]
注:当外部浏览器请求www.domain.com时被解析到IP地址1.2.3.4 ,Apache 交出 
mod_rewrite处理转换成 
http://192.168.1.3/$1后再交由代理模块mod_proxy得到内容后传送回用户的浏览器。
 4) 基本预先设定的转换MAP表进行重写 rewritemap
转换www.domain.com/{countrycode}/anypath 到Map表中规定的URI,上面是虚拟主机中的定义
rewritelog /usr/local/apache/logs/rewrite.log 
rewriteloglevel 9
rewriteengine on 
proxyrequest on 
rewritemap sitemap txt:/usr/local/apache/conf/rewrite.map 
rewriterule ^/([^/]+)+/(.*)$ http://%{REMOTE_HOST}::$1 [C] 
rewriterule (.*)::([a-z]+)$ ${sitemap:$2|http://h.i.j.k/} [R=301,L]
文件/usr/local/apache/conf/rewrite.map的内容如下:
sg http://a.b.c.d/ 
sh http://e.f.g.h/
注: 当用户请求http://www.domain.com/sg/anypath时被重写为 
http://a.b.c.d/anypath . 
当需要调试时请用rewritelog and rewriteloglevel 9联合,9为最大即得到最多的调试 
信息 
最小为1,最小的调试信息,默认为0,没有调试信息。 
sitemap的语法是${sitemap: LookupKey | Defaultvalue} ,有些书上把$写成了%是错 
误的。



0 0