页面静态化(JSP动态页面转静态化)相关

来源:互联网 发布:自动聊天软件 编辑:程序博客网 时间:2024/05/29 09:23
 

urlrewritefilter 下载:http://tuckey.org/urlrewrite/#download

所用基于动态的url http://www.nihaoblog.com/content.jsp?id=1&contentid=404按照各大搜索引擎的喜好,应该美化成http://www.nihaoblog.com/content/1_404.html静态网页的方式,尽管目前的google及几大搜索引擎宣称支持动态页网的抓取,但与传统的html文件相比较抓取率仍不在一个数量级。Apche的mod_rewrite模块具有此功能,但是对于租用虚拟主机的用户来说就比较麻烦不太可能对所有运营商有更多的要求,需要条件依赖就不具通用性。

    目前有一个解决方法,通过UrlRewriteFilter可以完全实现动态URL表态化,你可以将它直接应用到你的web应用中,不管你用的是jsp+javabean还是struts.
    
下面是使用方法:
    1、下载http://tuckey.org/urlrewrite/#download目前版本是1.2,解压缩后将文件考到相应的web-inf/lib和web-inf下,。
     2、配置web.xml
xml 代码
  1. <filter>   
  2.        <filter-name>UrlRewriteFilter</filter-name>   
  3.        <filter-class>org.tuckey.web.filters.urlrewrite.UrlRewriteFilter</filter-class>   
  4. </filter>   
  5. <filter-mapping>   
  6.        <filter-name>UrlRewriteFilter</filter-name>   
  7.        <url-pattern>/*</url-pattern>   
  8. </filter-mapping>  
根据自己的需要,将相应目录下的url转给UrlRewriteFilter来处理。
   3、配置urlwrite规则文件WEB-INF/urlrewrite.xml
http://www.nihaoblog.com/content.jsp?id=1&contentid=404
静态化为:
http://www.nihaoblog.com/content/1_404.html
配置如下:
  1. <rule>   
  2.     <from>/content/([0-9]+)_([0-9]+).html</from>   
  3.     <to>/content.jsp?id=$1&amp;contentid=$2</to>   
  4. </rule>  
xml 代码
   
注意:有多个参数时,中的连接符号&应该是&
熟悉正则表达式的朋友可能一看就是明白rule的匹配原理了。更多的配置可以参照http://tuckey.org/urlrewrite/manual/

每个网页或请求都是一个url地址,一般,这个地址可能是.do,.page,.action之类的并加上'?'号、'&'号查询串等构成的一个长长的的url。很urgly。

一般的url----------------------------------------------------------较好的url
http://www.xxx.net/user/profile.do?id=20001 ====> http://www.xxx.net/user/20001
http://www.xxx.net/forum/board.do?name=java ====> http://www.xxx.net/forum/java
http://www.xxx.net/forum/thread.do?id=29923 ====> http://www.xxx.net/thread/29923

后者明显较为直观和漂亮。

使用url rewrite可以很好的改善这个状况。网站url rewrite应用是非常广泛的,良好的url设计给用户带来的非常好的体验,同时也能吸引搜索引擎的注意。

一种rewrite称为一个规则,上面的例子就是3个规则。rewrite技术可以在代理服务器实现,或者可以在tomcat之类的javaweb服务器实现。 Apache HTTP Server 2.x 和mod_proxy提供了不错的Rewrite处理方法。so如果使用apache,则直接在apache中配置Rewrite即可。但是对于没有使用代理,或者不完全要在代理服务器配置Rewrite的web应用,通过第三方Jar包也是可以实现很perfect的rewrite技术的。这是本帖的着重点。

这个第三方包的地址是:http://tuckey.org/urlrewrite/ (待会再去这个网站,现在先别去)

这个包使用正则表达式仿照了apache rewrite的做法。而实现原理也是很明晰的:filter,forward,redirect机制组合:

在web.xml配置一个UrlRewriteFilter,拦截所有进来的请求,对服务要求的请求进行rewrite。比如,对http://www.xxx.net/user/([0-9]+)请求,forward到/profile.do?id=$1。这就是一条规则。在这个第三方包中的规则文件urlrewrite.xml中可以这样定义:

代码
  1. <rule>  
  2.     <from>^/user/([0-9]+)/?$from>  
  3.     <totype="forward">/profile.do?id=$1to>  
  4. <rule>  
<script>render_code();</script>

对我来说,一般我会配置一个通用的rule,使所有没有包含"."的url forward到.do的action上来(本人使用strut做系统较多)

代码
  1. <rule>  
  2.     <note>  
  3.          - 这是一个通用请求url rewrite   
  4.          - 将请求forword url加上“.do”的处理器上。   
  5.          - 例:   
  6.          -    请求 http://{domain}/user/login     将被forward到 http://{domain}/user/login.do   
  7.          -    请求 http://{domain}/user/login/    将被forward到 http://{domain}/user/login.do   
  8.          -    请求 http://{domain}/user/logout/   将被forward到 http://{domain}/user/logout.do   
  9.     note>  
  10.     <from>^/([_a-zA-Z]+[_0-9a-zA-Z-/]*[_0-9a-zA-Z]+)/?$from>  
  11.     <totype="forward">/$1.doto>  
  12. <rule>  
<script>render_code();</script>

上面只是介绍个大概,并不是urlrewriter这个jar包的使用指南。如果你觉得这种rewrite做法不错的话,不如直接访问这个网站吧 http://tuckey.org/urlrewrite/

第一步:从http://tuckey.org/urlrewrite/ 上下载urlrewrite-3.0.3.jar包,放到webapp classpath下

第二步:在web.xml配置UrlRewriteFilter:

代码
  1. <filter>  
  2.     <filter-name>UrlRewriteFilterfilter-name>  
  3.     <filter-class>  
  4.          org.tuckey.web.filters.urlrewrite.UrlRewriteFilter   
  5.     filter-class>  
  6.     <init-param>  
  7.         <param-name>logLevelparam-name>  
  8.         <param-value>WARNparam-value>  
  9.     init-param>  
  10. filter>  
  11. <filter-mapping>  
  12.     <filter-name>UrlRewriteFilterfilter-name>  
  13.     <url-pattern>/*url-pattern>  
  14. filter-mapping>  

<script>render_code();</script>

第三步:在web-inf下新建urlrewrite.xml文件,简单填入以下内容:

代码
  1. <!--sp-->xmlversion="1.0"encoding="utf-8"?>  
  2.      "http://tuckey.org/res/dtds/urlrewrite3.0.dtd">  
  3.   
  4. <urlrewrite>  
  5.     <rule>  
  6.         <note>  
  7.              - 这是一个通用请求url rewrite   
  8.              - 将请求forword url加上“.do”的处理器上。   
  9.              - 例:   
  10.              -    请求 http://{domain}/user/login     将被forward到 http://{domain}/user/login.do   
  11.              -    请求 http://{domain}/user/login/    将被forward到 http://{domain}/user/login.do   
  12.              -    请求 http://{domain}/user/logout/   将被forward到 http://{domain}/user/logout.do   
  13.         note>  
  14.         <from>^/([_a-zA-Z]+[_0-9a-zA-Z-/]*[_0-9a-zA-Z]+)/?$from>  
  15.         <totype="forward">/$1.doto>  
  16.     rule>  
  17.   
  18. urlrewrite>  

<script>render_code();</script>

第四步:启动web应用,将原来需要.do的请求改为去掉.do后请求,看看结果。

第五步:更详细的规则定义,请看http://tuckey.org/urlrewrite/manual/3.0/


大型网站的优化技术:1,SEO,优化一种,2,页面静态化3,memcache(内存缓存)4,服务器集群技术 总的目标:提高网站的访问速度,SEO目的:提高网站的排名,(解决的是速度)SEO: google 的优化,百度的优化: 今天先从页面静态化来讲:先讲几个概念:1,静态网址纯粹的html文档http://localhost/dir&file/var.html但是大家不要以为 后缀是html的就是静态网站, 2,动态网址(网站)localhost/dir&file/var.php?name=admin&id=2根据用户在地址栏传递不同的参数,显示不同的结果 3,伪静态网址伪静态的:TP框架的时候,url的几种模式:1,/ pathinfo2, MVC ?m=&a=3,重写模式:(和pathinfo模式区别:重写少了入口文件)修改apache的配置增加htacess文件tp框架中重写模式,伪静态:localhost/dir&file/news-id/2/name/admin.html 为什么要将动态网站改成静态的形式:1,/*1=1*/ 防止sql注入2,动态的网站不利于SEO,因为?后面的参数会动态的变化,搜索引擎抓取的时候,不知道该怎么保存,、sina.com/index.html index.php?act=index 原则:能不从数据库获得数据就尽量不要去操作数据库 如何实现页面静态化:页面静态化的分类:1,按照形式:1,真静态2,伪静态2,按照范围: 1,局部静态话(jquery,ajax) 2,全部静态化 搜索引擎:1,抓取你的网站的内容,不是一股脑的抓取所有的内容,都放到一块2,而是将你的内容进行归类,根据你的关键字,进行排名 如何做到SEO友好呢?1,百度的建议:url的长度:不能多于 255个字节搜索引擎抓取的时候:从首页开始触发:遇到一个页面抓取它的内容,将内容保存起来,www.sina.com/index.htmlwww.sina.com/news/soprt.html因为越短的抓取的越早,越频繁,更新就越快,认为你很好而且每个页面抓取的时间有限,每个页面最多分配 5秒之内当然网站越好,排名越高,分配的时间越长 2,meta 标签的keywords desciption 标签也是做给搜索引擎看的然SE 会根据你的关键字和描述进行大概的分类可以禁止搜索引擎抓取我们网站的内容:在网页代码的之间,加入nofollow属性!!如果是超链接,就是标签里加入rel="nofollow"即可!(2)robots.txt 关键字description (3)尽量不要在前台使用 frame framset , 后台可以使用,框架*(因为后台避免搜索引擎抓取)(4)flash,尽量使用图片代替,jquery做一些特效(5)图片,尽量给每一个图片增加 alt属性,图片还没有显示的时候,先显示alt提示文字 SEO优化---- 如何实现页面静态化:通过php的ob缓存来实现提高排名提高速度随着360综合搜索,出现,百度广告非常谨慎 1,通过php的ob缓存来实现通过工具可以测试,网站的访问速度apache自带了一个 ab.exe 这个工具可以检测你的网站的访问速度 php5.2 之前默认情况是关闭ob缓存,在php5.3之后,默认是开启ob缓存的在php.ini output buffering面试:使用开发环境:apache2.2.6 mysql 版本: 5.3 使用php的ob缓存实现页面静态化1,缓存:smarty缓存, ThinkPHP框架的缓存,PHP的ob缓存 (1)ob---缓存,先将输出的数据呢,缓冲到一块空间然后显示的时候再显示这块空间的缓存的数据因为默认有一些header信息,然后一遇到echo ,就会给浏览器会送数据因为默认的header已经随着echo被发送到浏览器了 ob缓存入门没有错误提示了呢?引出ob缓存的原理:php的缓存:(1)ob缓存先判断一下,是否开启ob缓存,如果你开启了,先将输出的数据放到ob缓存中,如果你没有开启ob缓存,然后放到程序缓存中 (2)程序缓存就是如果没有开启ob缓存,先将数据缓存到程序中,等echo都完了,再统一的输出 浏览器也有缓存:浏览器先攒着数据,等达到一定的数量之后(ie 500多MB)的时候才输出 如何获得缓存的数据 1,ob_start() 先将输出的数据优先放入到 ob缓存中2,ob_clean() 清空缓存,但是没有关闭3,ob_end_clean() 清空缓存,同时也关闭缓存4,ob_flush() 将ob缓存的数据,输出到程序缓存5,ob_end_flush() 将ob缓存的数据输出到程序缓存并且关闭ob缓存 ob_flush(); //只是将ob缓存的数据,输出到程序缓存ob_end_flush(); //输出之后再将ob缓存缓存关闭 flush() 会将程序缓存的数据,输出到浏览器缓存浏览器缓存:类似于php的程序缓存,先将每一个输出输出到程序缓存,等输出完毕再显示到浏览器 PHP的缓存机制:1,ob缓存,如果开启了ob缓存,优先将数据放到ob缓存中2,程序缓存,如果没有开启ob缓存,再将数据缓存到程序缓存 页面静态化案例:新闻管理系统:output_buffering = Off 关闭缓存 补课说了一下:mysql数据类型:varchar(32) : 显示多少位 varchar(255) : 一个字母、数字,占多少个字节:utf-8 2 汉字:3gbk 都是占1个字节 1个varchar 表示的长度范围 0-65535之间 varchar(255) char 定长的字符串: char(255) 编码的位数,255指的是显示/保存多少位char() 定长,不管你存储了多少,都站指定的字节数 int: 最长是429.。。 15175290987 百亿 表示4个字节tinyint: 1个字节 0-255 unsigned myisam: 和 innodb: 区别1,myisam 不支持事务,innodb支持事务2,myisam 查询速度比innodb快,3,myisam 不支持外键,innodb支持外键(mysql的新版本已经支持外键) 外键,保持数据的完整性,事务:逻辑上的一组操作,组成这组操作的各个单元,要么都成功,要么都失败三大特性:原子型一致性 完整的项目,不是统一的都是myisam也不是都是innodb 而是根据具体的业务 问题:每次访问都要查询数据库,频繁的操作数据库,造成服务器,数据库压力增加,而且用户可能在10分钟之内新闻内容不会更新,所以我们这样:第一个人访问之后,生成静态页面,第二个人,3,4 再访问这个页面的时候,直接显示静态页面 这个时候有个问题:如果新闻不幸更新了,该怎么办?1,判断 最终,要添加新闻的时候,或者修改新闻的时候,都应该生成静态页面 添加新闻的时候生成静态页面:提交之后,显示入库,然后生成静态页面 涉及模板替换内容创建一个模板文件,当样式基本固定,但是内容不确定的时候,先用占位符代替数据部分然后,获得数据之后,在替换过来r fopen()w fgets()函数,读取一行内容(只是)fopen() 打开文档 r w fwrite() 向打开的这个文档中写入内容feof() 测试当前文档是否读取到了结尾fclose() 打开文档后一定要记得关闭file_put_contents() 向一个文件中写入内容file_get_contents() 读取文件的内容 1,网站分类2,网站优化百度 对网站优化建议:5点3,如何检测网站性能(访问速度)4,ob缓存开头
0 0
原创粉丝点击