java 配置Apache,Tomcat的gzip压缩功能

来源:互联网 发布:multiselect.js 宽度 编辑:程序博客网 时间:2024/05/16 14:28
HTTP 压缩可以大大提高浏览网站的速度,它的原理是,在客户端请求网 页后,从服务器端将网页文件压缩,再下载到客户端,由客户端的浏览器负责解 压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ,它可以节省40%左右的流量。更为重要的是,它可以对动态生成的,包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩,压缩效率惊人

一 对于Tomcat5.0以后的版本是支持对输出内容进行压缩的. 使用的是gzip压缩格式

下 面是tomcat5.5.20 中的$tomcat_home$/conf/server.xml的原内容 1      < Connector  port ="80"  maxHttpHeaderSize ="8192" 
                maxThreads ="150"  minSpareThreads ="25"  maxSpareThreads ="75" 
             enableLookups ="false"  redirectPort ="8443"  acceptCount ="100" 
                 connectionTimeout ="20000"  disableUploadTimeout ="true"  URIEncoding ="utf-8"   /> 
      <!--  Note : To disable connection timeouts, set connectionTimeout value
      to 0  -->
     
      <!--  Note : To use gzip compression you could set the following properties :
     
                compression="on" 
                compressionMinSize="2048" 
                noCompressionUserAgents="gozilla, traviata" 
                compressableMimeType="text/html,text/xml"

    -->从上面的第 8行内容可以看出,要使用gzip压缩功能,你可以在Connector实例中加上如下 属性即可


1) compression="on" 打开压缩功能
2) compressionMinSize="2048" 启用压缩的输出内容大小,这里面默认为2KB
3) noCompressionUserAgents="gozilla, traviata" 对于以下的浏览器,不启用压缩 
4) compressableMimeType="text/html,text/xml" 压缩类型(默认为text/html,text/xml,text/plain)

我 这里的配置内容为:
     <Connector port="80" maxHttpHeaderSize="8192"
                maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
                enableLookups="false" redirectPort="8443" acceptCount="100"
                connectionTimeout="20000" disableUploadTimeout="true" URIEncoding="utf-8"
                   compression="on" 
                compressionMinSize="2048" 
                noCompressionUserAgents="gozilla, traviata" 
               compressableMimeType="text/html,text/xml,text/javascript,text/css,text/plain"  />
    <!-- Note : To disable connection timeouts, set connectionTimeout value
     to 0 -->
  
    <!-- Note : To use gzip compression you could set the following properties :
 
               compression="on" 
               compressionMinSize="2048" 
               noCompressionUserAgents="gozilla, traviata" 
              compressableMimeType="text/html,text/xml"
   -->


一旦启用了这个压缩功能后,我们怎么来测试压缩是否有效呢?首先Tomcat是根据浏览器请求头中的accept-encoding来判断浏览器是否支持 压缩功能,如果这个值包含有gzip,就表明浏览器支持gzip压缩内容的浏览,所以我们可以用httpclient来写一个这样的简单测试程序

import org.apache.commons.httpclient.HttpClient;
import org.apache.commons.httpclient.methods.GetMethod;


public class HttpTester {

public static void main(String[] args) throws Exception{
  HttpClient http = new HttpClient();
  GetMethod get = new GetMethod("http://www.dlog.cn/js/prototype.js");
  try{
  get.addRequestHeader("accept-encoding", "gzip,deflate");
  get.addRequestHeader("user-agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; Alexa Toolbar; Maxthon 2.0)");
  int er = http.executeMethod(get);
  if(er==200){
   System.out.println(get.getResponseContentLength());
   String html = get.getResponseBodyAsString();
   System.out.println(html);
   System.out.println(html.getBytes().length);
  }
}finally{
   get.releaseConnection();
}
}

}

执行这个测试程序,看看它所输出的是什么内容,如果输出的是一些 乱码,以及打印内容的长度远小于实际的长度,那么恭喜你,你的配置生效了,你会发现你网站的浏览速度比以前快多了。



二, 对于Apache而言,有两种情况
 
1)针对Apache2.0之前的版本,它原本是不支持 的,不过可以通过添加第三方的module_gzip模块来启用
 2)针对Apache2.0及之后的版本,Apache提供支持, 不过不叫gzip,而叫mod_deflate
下面就对Apache2.0及之后的版本作一个说明
1) 去掉#LoadModule headers_module modules/mod_headers.so前面的注释#,
2) 添加LoadModule deflate_module modules/mod_deflate.so
3) 在VirtualHost中添加
1    <Location "/">
2        SetOutputFilter DEFLATE
3        BrowserMatch ^Mozilla/4 gzip-only-text/html
4        BrowserMatch ^Mozilla/4\.0[678] no-gzip
5        BrowserMatch \bMSIE !no-gzip !gzip-only-text/html
6        SetEnvIfNoCase Request_URI \.(?:gif|jpe?g|png)$ no-gzip dont-vary
7        Header append Vary User-Agent env=!dont-vary
8    </Location>
9
我这里面有一个完整的演示
 1# 加载deflate模块
 2LoadModule headers_module modules/mod_headers.so
 3LoadModule deflate_module modules/mod_deflate.so
 4<VirtualHost *:80>
 5    DocumentRoot f:/apacheTest
 6    <Location "/">
 7        SetOutputFilter DEFLATE
 8        BrowserMatch ^Mozilla/4 gzip-only-text/html
 9        BrowserMatch ^Mozilla/4\.0[678] no-gzip
10        BrowserMatch \bMSIE !no-gzip !gzip-only-text/html
11        SetEnvIfNoCase Request_URI \.(?:gif|jpe?g|png)$ no-gzip dont-vary
12        Header append Vary User-Agent env=!dont-vary
13    </Location>
14</VirtualHost>
关于 JavaScript的gzip静态压缩方法传统的JS压缩(删除注释,删除多余空格等)提供的压缩率有时还是不尽不意,幸亏现在的浏览器都支持压缩传输(通过设置http header的Content-Encoding=gzip),可以通过服务器的配置(如apache)为你的js提供压缩传输,或是appfuse中使 用的GZipFilter使tomcat也提供这种能力

现在的问题是这种动态的压缩会导致服务器CPU占用率过高,现在我想到的解决辨法是通过提供静态压缩(就是将js预先通过gzip.exe压缩 好)

一.下面描述在tomcat中的应用

1.将prototype.js通过gzip.exe压缩保存成prototype.gzjs
2.设置header,我编写了一个简单的AddHeadersFilter来将所有以gzjs结尾的文件增加设置header Content-Encoding=gzip
web.xml中的配置
<filter>

<filter-name>AddHeaderFilter</filter-name>

<filter-class>

badqiu.web.filter.AddHeaderFilter

</filter-class>

<init-param>

<param-name>headers</param-name>

<param-value>Content-Encoding=gzip</param-value>

</init-param>

</filter>



<filter-mapping>

<filter-name>AddHeaderFilter</filter-name>

<url-pattern>*.gzjs</url-pattern>

</filter-mapping>



测试prototype.js是否正常的代码
<html>

<head>

<!-- type="text/javascript"不可少,有些浏览器缺少这个不能运行,具体已经忘记了 -->

<script src="prototype.gzjs" type="text/javascript"></script>

</head>

<body>

<input id="username" name="username" value="badqiu"/><br />

<input id="email" value="badqiu@gmail.com"/>

<script>

<!-- 测试prototype的方法是否正常-->

alert($F('username'))

</script>

</body>

</html>



在Apache httpd中可以直接通过在httpd.conf增加AddEncoding x-gzip .gzjs来映射.gzjs文件的header

二.相关压缩率数据
1. prototype.js 1.5.0_rc0原始大小56KB,未经任何处理直接使用gzip压缩为12KB,总压缩率79%
2. 通过js压缩工具压缩过的protytype.js为20KB,使用gzip压缩为10KB,总压缩率为83%
3. 实际项目中的多个js合并成的文件 439KB,直接通过gzip压缩为85KB,总压缩率81%
4. 439KB经过js压缩为165KB,再经过gzip压缩为65KB,总压缩率86%

基本上你都可以忽略js压缩工具的压缩率,直接使用gzip压缩

gzip下载地址 http://www.gzip.org
tomcat的压缩配置示例下载地址: http://www.blogjava.net/Files/badqiu/gziptest.rar