Java WEB实现URL重写的优缺点及实现的三种方法(整理)

来源:互联网 发布:steam方舟和淘宝的方舟 编辑:程序博客网 时间:2024/06/06 08:40

一、什么是url重写

URL重写,其实就是把带一大堆参数的url,变成一个看上去很规矩的url。
例如:将/test.jsp?id=100111重写 ,重写后可以用/test/100111.html表示

通常我们为了更好的缓解服务器压力,和增强搜索引擎的友好面,都将文章内容生成静态页面。
但是有时为了能实时的显示一些信息,或者还想运用动态脚本解决一些问题,不能用静态的方式来展示网站内容,必须用到动态页面显示。

这样以来,就损失了对搜索引擎的友好面,怎么样在两者之间找个中间方法呢,如何增强你网站中地址的可读性和让搜索引擎快速的收录到你的站点?

这就需要你美化你的网页的地址,这就产生了伪静态技术,也就是我们常说的Url Rewriter重写技术。就是当我们访问一个页面时,地址栏中展示出来的是以“.html”为结尾的静态页面形式,而实际上我们访问的动态网页。这里就需要用到UrlRewriter技术。

二、URL重写的优缺点: 

使用Url重写的优点:

1:有利于搜索引擎的抓取,因为现在大部分的搜索引擎对动态页面的抓取还比较弱,它们更喜欢抓取一些静态的页面。而我们现在的页面大部分的数据都是动态的显示的。这就需要我们把动态页面变成静态的页面,有利于搜索引擎的抓取。
2:让用户更容易理解,很少有用户去关心你网站的页面的地址,但对一般的大中型网站增强可读性还是必须的。这样会让你的网站更加完美。
3:隐藏技术的实现,我们可以通过Url重写可以实现技术的隐藏。不至于暴露你所采用的技术,给一些想攻击你网站的爱好者提供方便。

4:可以很方便的重用,提高网站的移植性。如果我们后台方法改动的话,可以保证前台的页面部分不用改。这样就提高了网站的移植性。

大家熟悉的可能有很多服务器都提供Url重写的技术,以前我们用的最多的就是Apache,Jboss这样一些服务器自带的一些Url重写,但是他们的配置比较麻烦,性能又不是太好。现在我们有专一的开源框架来完成Url重写任务,今天我要介绍的就是UrlRewriteFilter,它使用起来比较简单。UrlRewriteFilter是一个用于改写URL的Web过滤器,类似于Apache的mod_rewrite。适用于任何Web应用服务器(如Resin,Orion,Tomcat等)。其典型应用就把动态URL静态化,便于搜索引擎爬虫抓取你的动态网页。
我们先简单的了解一下使用Url重写能给你网站带来哪些好处。

使用Url重写也有缺点:

因为URL是通过过滤器原理来实现的,就以为着又多了一道访问,会多少影响点访问速度的,这个可以忽略不计,它的工作原理说白了它就是一个简单的过滤器(Filter),将请求的url 转换成我们想要的url,再对它进行请求的过程。

三、URL重写的几中实现方法

1、自定义过滤器示例:

(1)在web.xml中配置过滤器

[html] view plain copy
  1. <filter>   
  2. <filter-name>urlFilter</filter-name>   
  3. <filter-class>com.url.filter.URLFilter</filter-class>   
  4. </filter>   
  5.   
  6. <filter-mapping>   
  7. <filter-name>urlFilter</filter-name>   
  8. <url-pattern>*.shtml</url-pattern>   
  9. </filter-mapping>   

(2)新建解析规则的配置文件 urlRewrite.xml

[html] view plain copy
  1. <?xml version="1.0" encoding="utf-8"?>   
  2. <urlRewrite>   
  3.   <rule>   
  4.      <from>^/(\w+)_(\w+)_(\d+)\.shtml$</from>  匹配表达式-正则表达式   
  5.      <to type="forward">/$1.do?$2=$3</to>  解析后URL   
  6.   </rule>   
  7. </urlRewrite>   
(3)过滤器处理类 URLFilter.java 
[java] view plain copy
  1. public class URLFilter implements Filter {   
  2.     public void doFilter(ServletRequest servletRequest, ServletResponse       
  3.                               servletResponse, FilterChain filterChain) throws    
  4.                                         IOException,ServletException   
  5.     {   
  6.        HttpServletRequest request = (HttpServletRequest) servletRequest;   
  7.        HttpServletResponse response = (HttpServletResponse) servletResponse;   
  8.        String realPath   
  9.                     =request.getSession().getServletContext().getRealPath("/");   
  10.   
  11.        String fileName = realPath + "WEB-INF\\urlrewrite.xml";   
  12.        String uri = request.getServletPath();   
  13.        String rewriteUrl = getRewriteUrl(uri, fileName);   
  14.        if (null != rewriteUrl) {   
  15.            request.getRequestDispatcher(rewriteUrl).forward(request, response);   
  16.            return;   
  17.        }   
  18.        filterChain.doFilter(servletRequest, servletResponse);   
  19.   
  20.     }   
  21.   
  22.     private String getRewriteUrl(String url, String fileName) {   
  23.        DocumentBuilderFactory f = DocumentBuilderFactory.newInstance();   
  24.        try {   
  25.            DocumentBuilder builder = f.newDocumentBuilder();   
  26.            Document document = builder.parse(fileName);   
  27.            NodeList list = document.getElementsByTagName_r("rule");   
  28.            for (int i = 0; i < list.getLength(); i++) {   
  29.               Element elemnt = (Element) list.item(i);   
  30.               NodeList list2 = elemnt.getElementsByTagName_r("from");   
  31.               Element element = (Element) list2.item(0);   
  32.               String formValue = element.getFirstChild().getNodeValue();   
  33.               NodeList list3 = elemnt.getElementsByTagName_r("to");   
  34.               Element element2 = (Element) list3.item(0);   
  35.               String type = element2.getAttribute("type");   
  36.               String toValue = element2.getFirstChild().getNodeValue();   
  37.               String rewriteUrl = url.replaceAll(formValue, toValue);   
  38.               if (url != null && !"".equals(url.trim()) &&   
  39.                                                     !url.equals(rewriteUrl)) {   
  40.                   return rewriteUrl;   
  41.               }   
  42.            }   
  43.        } catch (Exception ex) {   
  44.            ex.printStackTrace();   
  45.        }   
  46.        return null;   
  47.     }   
  48. }   

2、Tomcat的过滤器组件 

(1)下载urlrewrite

http://tuckey.org/urlrewrite/dist/urlrewritefilter-2.6.zip
http://urlrewritefilter.googlecode.com/files/urlrewritefilter-3.1.0.zip
把 urlrewrite-2.6.0.jar拷到classpath下。 

(2)在WEB-INF目录下建一个urlrewrite.xml文件。

不要习惯Java的命名法把它写成urlRewrite.xml,

[html] view plain copy
  1. <?xml version="1.0" encoding="utf-8"?>   
  2. <!DOCTYPE urlrewrite PUBLIC "-//tuckey.org//DTD UrlRewrite 2.6//EN"   
  3. "http://tuckey.org/res/dtds/urlrewrite2.6.dtd">   
  4. <urlrewrite>   
  5. <rule>   
  6. <from>^/(\w+)_(\w+)_(\d+)\.shtml$</from>   
  7. <to type="forward">/$1.do?$2=$3&pageSize=15</to>   
  8. </rule>   
  9. </urlrewrite> 
解释:
<from></from>写上你自己定义的访问地址
<to type="forward></to>就是实际的访问地址。
比如我们实际的访问地址是:/URLRewriterDemo/ uRLTestAction.do?pageNumber=123
而我们想把它重写:/URLRewriterDemo/uRLTestAction_pageNumber_123.shtml
这样看起来比我们实际的要好看的多。我们就应该这样的写
[html] view plain copy
  1. <rule>   
  2. <from>^/(\w+)_(\w+)_(\d+)\.shtml$</from>   
  3. <to type="forward">/$1.do?$2=$3&pageSize=15</to>   
  4. </rule>  

注意:常用的&要用 &amp; 来表示。$1,$2代表与你配置正规表达式>/(\w+)/(\w+)/相对应的参数。<to type="forward">默认的是 type="forward".

除了支持指定规则的跳转外,UrlRewrite还支持当匹配规则的时候执行某个对象的某个函数

如上述设置,要实现匹配规则是执行某个函数,需要添加多一个run节点,在节点上面添加对应的类属性和方法属性。同时,对应的类必须继承 RewriteRule类,执行的方法必须传入两个参数,分别是HttpServletRequest 和HttpServletResponse

  1. public class Demo extends RewriteRule{ 
  2.  
  3.     public void log(HttpServletRequest request,HttpServletResponse response){ 
  4.         System.out.println("haha1"); 
  5.     } 
  6.  
  7.     public void log2(HttpServletRequest request,HttpServletResponse response){ 
  8.         System.out.println("haha2"); 
  9.     } 
  10. }

这样,当客户端输入的网址第一次匹配到指定规则的时候,UrlRewrite就会执行对应的函数,该函数只在第一次匹配成功的时候执行。

如果想要每次匹配规则都执行某函数,可以在urlrewrite添加class-rule子节点,该节点设置后,每次匹配规则后,指定的函数都会执行一次。

  1. <class-rule class="com.sean.action.Demo" method="log2"/>
除了对请求的URL进行处理外,UrlRewrite还提供了对返回页面中的地址进行重写的功能。使用rule是对用户输入的url进行处理,但是开发过程中,经常需要在页面中也添加一些网址请求,UrlRewrite可以通过规则,对页面中的网址也进行重写。如:

  1. <outbound-rule match-type="regex"
  2.          <from>/(\w+).action\?id=(\w+)$</from> 
  3.          <to>/$1.html</to> 
  4. </outbound-rule>

  1. <rule> 
  2.          <from>^/demo3/(\w+)/(\w+).html$</from> 
  3.          <run class="com.sean.action.Demo" method="log" /> 
  4.          <to type="redirect" >/Struts/$1.action?age=$2</to> 
  5. </rule>

简单的介绍一下常用的正规表示式
代码说明
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束
常用的&要用 &来表示。$1,$2代表与你配置正规表达式>/(\w+)/(\w+)/相对应的参数。<to type="forward">默认的是 type="forward"。
另一个常用的规则就是连接外部的网站。就要用到<to type="redirect">。

(3)在web.xml中初始化。加上下面的代码:

[html] view plain copy
  1. <filter>   
  2. <filter-name>UrlRewriteFilter</filter-name>   
  3. <filter-class>   
  4. org.tuckey.web.filters.urlrewrite.UrlRewriteFilter   
  5. </filter-class>   
  6. </filter>   
  7. <filter-mapping>   
  8. <filter-name>UrlRewriteFilter</filter-name>   
  9. <url-pattern>*.shtml</url-pattern>   
  10. </filter-mapping>  

3、使用系统的404错误进行

当请求时肯定是找不见相关页面了,那就跳到Error.jsp 进行相应的处理

(1)加入错误跳转配置 web.xml

[html] view plain copy
  1. <error-page>   
  2. <error-code>404</error-code>   
  3. <location>/error.jsp</location>   
  4. </error-page> 

(2)写错误页面 Error.jsp

[java] view plain copy
  1. <%@ page language="java" contentType="text/html; charset=GBK" pageEncoding="GBK"%>   
  2. <%   
  3. response.setStatus(HttpServletResponse.SC_OK);   
  4. String key = (String)   
  5. request.getAttribute("javax.servlet.forward.servlet_path");   
  6. String reg = "^/(\\w+)_(\\w+)_(\\d+).shtml$";   
  7. String rewriteUrl = key.replaceAll(reg,"/$1.do?$2=$3&pageSize=15");   
  8. if(key != null || !key.equals(rewriteUrl)){   
  9. request.getRequestDispatcher(rewriteUrl).forward(request,response);   
  10. }   
  11. else{   
  12. out.print("对不起,您请求的页面没有找到! ");   
  13. }   
  14. %>   

<to type="forward">默认的是 type="forward"。
另一个常用的规则就是连接外部的网站。就要用到<to type="redirect">。

<RULE></RULE>
<FROM></FROM>^/rss/yahoo\.html$
<TO type="redirect"></TO> http://add.my.yahoo.com/rss? url= http://feed.feedsky.com/ MySiteFeed

以上就是UrlRewrite的一些常见的用法。关于UrlRewrite,网上也有人说这个会影响性能,因为在每次请求的时候都需要经过换一次过滤,但是这个还是要见仁见智,毕竟,使用URL重写,对网址还是有好处的。

0 0
原创粉丝点击